政府采购IT网_IT采购网-政府采购信息网

深度学习如何使计算机获得视觉?

政府采购信息网  作者:  发布于:2016-10-08 09:51:39  来源:网易科技
投稿邮箱为:tougao@caigou2003.com,投稿时请附作品标题、作者姓名、单位、联系电话等信息,感谢您的关注与支持!一经采用,本网会根据您的文章点击情况支付相应的稿酬。
  Claire Bretton是daco.io的联合创始人之一。dico.io是一家创业公司,目前正在研究一种独特的工具。此前,她是一家位于巴黎的顶级战略咨询公司的经理,有欧洲管理学院硕士学位。
 
  如何加入网络
 
  二十一世纪的最大挑战之一是使计算机能够更像人类的大脑。我们想让计算机说话、理解问题并解决问题,现在我们想让计算机获得视觉并辨别图像。
 
  很长一段时间以来,最聪明的电脑都是盲人。现在,他们可以看到。
 
  这很有可能是一场由深度学习引发的革命。
 
  机器学习:第一步
 
  了解机器学习很容易,它的主要想法是在大型数据库上训练算法,让它们能用新的数据预测结果。
 
  有一个简单的例子:我们想根据一棵树的直径来预测它的年龄。该数据库只包含三种数据:输入(X,树的直径),输出(Y,树的年龄)和特征(A,B:树的类型,森林的位置……)。一旦这个训练阶段完成,计算机将能够根据任意的新的直径(x)预测树的正确年龄(Y)。
 
  这是一个过于简单化的描述;当我们谈论图像识别时,它会变得更加复杂。
 
  对于一台电脑来说,一张图片是数以百万计的像素,这是大量的数据,对于一个算法来说也是庞大的输入。研究人员不得不去寻找一条捷径。第一个解决方案是定义中介特征。想象你想让计算机识别一只猫。首先,你必须定义一只猫的所有主要特征:一个圆圆的脑袋,两只锋利的耳朵,一个口鼻。一旦关键特征定义完成,训练得很好的神经网络算法将具有足够的精度水平,能够进行分析并确定这张图片是否是一只猫。
 
  那么如果我们选取一个更复杂的物品呢?
 
  你要怎样向电脑描述一个裙子呢?
 
  你将会遇到使用机器学习来进行图像识别的第一个限制:我们往往无法定义出具有接近百分百识别可能性的不同特征。
 
  深度学习:在没有人为干预的条件下看见和学习
 
  在本世纪初,斯坦福大学人工智能实验室和视觉实验室主任Fei-Fei Li,就感悟到:孩子们如何学习一个物品的名称?他们如何能认出一只猫或一件衣服?父母并不会通过描述特征来教会孩子这些,而是每当孩子们看到一个物品或动物时就告诉他们它的名字。他们通过视觉的例子来培养孩子。为什么我们不能在计算机上做同样的事情?
 
  然而,仍然有两个问题存在:数据库可用性和计算能力。
 
  首先,我们如何得到一个足够大的数据库来“教计算机如何看”? 为了解决这个问题,Li和她的团队于2007推出了图像网络项目。2009年,在全球180个国家的50000多人的合作下,他们创造了世界上最大的图像数据库:1500万个已命名和已分类图像,涵盖22000大类。
 
  现在,计算机可以在没有人为干预的前提下,在海量的图像数据库上训练自己,来获得识别关键特征的能力。就像一个三岁的孩子一样,电脑会看到数以百万计的已命名图像,并且靠他们自己来理解每个图像的主要特点。这些复杂的特征提取算法使用的是深度神经网络,这需要成千上万的节点。
 
  这只是深度学习的开始:我们设法让电脑像一个3岁的孩子一样去看,但是正如Li在TED演讲中所说的,“真正的挑战是未来:我们如何帮助计算机将他们的识别能力实现从三岁到十三岁的跨越?“
本网拥有此文版权,若需转载或复制,请注明来源于政府采购信息网,标注作者,并保持文章的完整性。否则,将追究法律责任。
网友评论
  • 验证码: