谷歌DeepMind:提高人工智能学习能力
政府采购信息网 作者: 发布于:2016-11-19 09:54:31 来源:新浪科技
投稿邮箱为:tougao@caigou2003.com,投稿时请附作品标题、作者姓名、单位、联系电话等信息,感谢您的关注与支持!一经采用,本网会根据您的文章点击情况支付相应的稿酬。
谷歌DeepMind人工智能部门的研究人员周四在网上发表论文称,他们已经在机器学习系统的速度和性能上实现了跨越,部分原因在于这套系统整合了一种技术,模拟了动物做梦的方式。

该论文解释道DeepMind的这套名为Unreal的新系统完成3D迷宫游戏《Labyrinth》的速度,比现有的一流人工智能软件还快10倍,甚至可以达到顶尖人类玩家87%的速度。
“我们的训练速度大幅提升,需要的训练经验也大幅减少,所以数据效率大大提高。”DeepMind研究员麦克斯·加德伯格(Max Jaderberg)和沃罗戴米尔·米涅(Volodymyr Mnih)写道。他们表示,由于缩短了训练时间,Ureal可以让DeepMind研究人员更快地尝试新的想法。
DeepMind的人工智能产品已经在视频游戏中取得了不错的成绩,尤其是雅达利的《突出重围》。
苹果迷宫
《Labyrinth》是DeepMind开发的一种游戏环境,在一定程度上参考了热门视频游戏《Quake》的设计风格。在该游戏中,机器需要寻找走出迷宫的路径,并通过收集苹果来获得分数。
这种风格的游戏是人工智能的重要研究领域,因为这类游戏中得分并获得正反馈的频率低于其他类型的游戏。另外,无论任何时候,人工智能软件只能在一定程度上了解迷宫的布局。
研究人员实现突破的一种方法是让Unreal重放之前在游戏中做出的尝试,然后集中精力研究在此前获得分数的情况。他们在论文中表示,这相当于让动物更加频繁地梦到正面奖励事件和负面奖励事件。
研究人员还会让系统同时重视几个不同的标准,而不是单纯关注游戏的整体分数,以此加快学习速度。其中之一就是如何通过各种动作改变视觉环境。“重点是学习你的动作如何影响你所看到的东西。”加德伯格和米涅说。
他们表示,这也类似于新生儿学习通过控制环境来获得回报——比如越来越多地曝光在令他们愉悦的视觉刺激中,例如闪亮而鲜艳的物体。
加德伯格和米涅表示,目前就谈论Unreal或类似的系统在现实世界中的应用还为时尚早。
游戏冠军
从国际象棋到美国电视智力竞赛《危险边缘》,在类似的游戏中获胜一直都被视作人工智能的重要里程碑。DeepMind也在今年早些时候取得了类似的突破:在与韩国围棋国手李世石的对战中将其击败。
DeepMind本月早些时候宣布开发了一个接口,可以利用机器学习软件参与《星际争霸II》游戏。DeepMind研究人员奥里奥尔·温亚尔斯(Orio Vinyals)表示,《星际争霸》被视作人工智能与人类对战的下一个目标,因为该游戏的很多方面都与现实世界一样混乱。Unreal有望帮助DeepMind掌握这些游戏的机制。
提升性能
DeepMind的Unreal在57种老式雅达利游戏中的学习速度和得分都超过了该公司现有的软件。研究人员称,Unreal玩这些游戏时的表现平均比顶尖人类选手高出880%,比DeepMind老式人工智能系统高出853%。
但在《Montezuma’s Revenge》等最复杂的雅达利游戏中,这套新系统也实现了更大的飞跃。他们表示,老系统在该游戏中的得分是0,而Ureal则拿到了3000分,超过人类顶尖选手的最好成绩的一半。(书聿)
本网拥有此文版权,若需转载或复制,请注明来源于政府采购信息网,标注作者,并保持文章的完整性。否则,将追究法律责任。
下一篇:制造业将迎来“智慧云制造”时代
网友评论
- 《佛山市国土规划信息化统筹整合总体方案》编制中标结果公告
- 青龙县公安局机关高清数字审讯记录系统和执法六必录系统招标公告
- 智慧政务软件开发及升级项目的中标公告
- 黄家花园幼儿园信息化项目的中标公告
- 仁化县基层服务平台光纤传输网络租赁服务及购置视频监控平台采购项目(第二次重招)中标公告
- 山东省人民政府采购中心、山东省省级机关政府采购中心2016年山东省第二期批量集中采购-便携式计算机、台式一体机中标公告
- 容桂街道视频监控系统维护维修服务采购中标公告
- 成安县司法局社区矫正视频监控系统采购项目更正公告
- 关于郑州轻工业学院计算机、物联网与信息类实验室设备项目废标公告
- 保定国家高新技术产业开发区机关后勤服务处管委会视频监控系统公开招标公告