HCR强化学习智能应用之赋能工业(上)

来源:HCR慧辰资讯 时间:2019-07-23 06:36:44

些年科技进步的速度有点快:

 

从2012年开始深度学习取得飞跃式发展,在人脸识别、语音识别、机器翻译等领域开始大量应用。

 

从2016年开始强化学习又火了一把,阿尔法狗先后战胜世界顶级围棋棋手李世乭和柯洁,OpenAI-Five打Dota2(一种竞技游戏)也战胜了人类选手。

 

作为一家数据智能公司,HCR持续关注最前沿的人工智能技术,并不断应用到实际的业务场景。

 

HCR已经将深度学习和强化学习应用到了大量领域:

应用领域

应用点

相关技术

环保

区域污染物智能溯源

深度学习

区域空气质量智能预测

深度学习

教育

试题知识点智能识别

深度学习

试题智能推荐

深度学习

学生成绩智能预测

深度学习

新零售

人脸识别

深度学习

人物属性识别

深度学习

消费者智能画像

深度学习

交通

智能助手

深度学习

智能用户画像

深度学习

车型识别

深度学习

工业

优化燃煤工业锅炉控制

强化学习+深度学习

优化机房制冷

强化学习+深度学习

 

那深度学习和强化学习有什么关系呢?通过公司近些年深度学习和强化学习的应用,我们总结如下:

 

相比之下,强化学习有哪些突出的特点呢?

 

强化学习通过智能体(如阿尔法狗)不断实践、探索来学习,每次探索包括以下几个步骤:

 

智能体能够感知环境(即下图中地球,可以理解为要解决的具体场景),观察当前状态(observation)

 

智能体根据策略,采取某种行动(action)

 

智能体采取行动后,环境对智能体的行动会有一个反馈(reward)

 

智能体获取反馈,根据反馈调整策略

强化学习与人类学习的方式更加相似,为什么HCR在实际业务中应用更多的却是深度学习?

 

目前深度学习在各领域应用四处开花,为什么强化学习仍主要应用于游戏,其他领域应用极少?

 

HCR已经将强化学习应用于工业大数据领域,包括燃煤工业锅炉控制优化、IDC机房制冷设备自动调控等,通过实践积累了大量的宝贵经验。

 

下篇我们会详细介绍强化学习在工业领域的应用,并回答为什么强化学习目前仍主要应用于游戏领域的问题,敬请期待下周的推送。