在谷歌、Facebook、微软和百度这些科技巨头的研究院里,关于人工智能和机器人视觉识别的研究项目正在日夜兼程的进行着。
“如果在服务机器人时代真正到来的那天,英特尔跟不上,那就有大麻烦了”
每年4月,英特尔都会在中国举办一场IDF(Intel Developer Forum)技术峰会,面向开发者发布最新的软件开发工具套件。今年的IDF,在深圳会场的一个小型闭门会议上,英特尔介绍的不再只是芯片,还有一款外表看起来圆滚滚的机器人原型。
在被布置成寻常客厅的小舞台上,当这款机器人“看到”角落里跌倒的人体模型时,它小心翼翼地走过去并仔细“询问”。了解了简要情况后,机器人立即开启了位于“胸前”的视频通话屏幕,及时接通了跌倒者“家人”的电话。这一系列动作都是机器人自主完成的。
长出“眼睛”的机器人
这是一款被定位于为老年人提供陪护的家用服务机器人。“它有自己的表情和肢体动作,能催促老年人按时吃药、多做运动,”这款机器人的介绍者、英特尔中国研究院院长宋继强说,“最为关键的是,它能在室内自由移动,时刻观察家中成员的状态。它能自己找到充电的地方。”
不过,想让这款原型成为人们理想中的“家庭助手”,目前还是非常遥远的目标,因为它现在行动比较缓慢,反应也不够灵敏。但是在宋继强看来,这款原型的面世仍具一定意义:“现在市面上的机器人还处于早期阶段,还没有出现可产业化的消费级机器人。现阶段我们需要做到的是让机器人自主移动,不撞到人和东西,并且能成功观察家庭成员的状态。”
为了早日让机器人成为人们理想中的“家庭助手”,英特尔中国研究院里的研究员们正在努力让机器人做到第一步,即“感知世界”——更确切地说是让机器人长出“眼睛”来。这一在人类身上看上去微不足道的功能,要在机器人身上实现并不容易。机器人需要以实时视频流的方式将捕捉到的图像数据传输到专用服务器中,并通过机器的视觉识别算法对数据进行分析处理。算法最终再把处理结果反馈输出给机器人,让机器人做出下一步的动作。只有如此,机器人才能理解人类的状态,并真正为人类提供帮助。
在英特尔中国研究院中的60位工程师团队最主要的研究方向就是这种视觉识别算法。去年,由英特尔中国研究院的两名研究员和两名实习生组成的团队,在第三届ACM ICMI 2015 EmotiW(Third Emotion Recognition in the Wild Challenge)大赛基于视频情绪识别任务的比赛中击败了包括微软和卡内基梅隆大学在内的竞争对手,获得了第一名。“我们现在主攻的识别算法分为几个方面:第一类是基于视觉的表情识别算法;第二类是物体识别;第三类则是对于人及其姿态的识别;第四类是针对周围环境的模型搭建。”宋继强说。这些技术的核心目的都是赋予机器人更好的认知世界的能力。
同时,以这些识别算法研究为基础的“自主机器”项目正成为英特尔中国研究院的研究重点,甚至已被列进了英特尔全球研究院的10个“绩效打赌”项目之一。之所以说“打赌”,是因为“这10个项目被看作是英特尔全球研究院中最有风险的领域,一旦成功,回报巨大,不过前期的风险也不小”,在英特尔工作9年、刚刚升任英特尔中国研究院院长的宋继强介绍说。在中国研究院里,总共有40%的研究人员正在自主机器项目上全力以赴。宋继强解释了该项目中“自主系统”对机器人而言的重要性。这和自动化机器的概念完全不同,“一台自动化的咖啡机或者别的机器能做的事情都是固定的,但是对机器人来说,最重要的是感知、决策和反馈能力,”他说,“这个系统将是英特尔由不同层级、来自软件硬件的技术共同组合在一起实现的。”
机器视觉识别属于人工智能的范畴,是信息技术革命中最大的亮点之一。在最近几年中,人工智能及其中的深度学习技术将机器视觉的性能推上了一个新高度,也让服务机器人这一崭新的市场加速到来。知名市场研究机构Marketst&Market的一份报告指出,简单劳动力不足以及老龄化等刚性驱动和科技发展正在促进服务机器人的快速发展,到2017年这个市场将达到461.8亿美元。
在谷歌、Facebook、微软和百度这些科技巨头的研究院里,关于人工智能和机器人视觉识别的研究项目正在日夜兼程的进行着。曾经引领世界计算进步的芯片公司英特尔自然也不敢轻视这股浪潮。宋继强认为英特尔的核心优势在于硬件和芯片:“人工智能、深度学习这些领域将是我们在芯片研究上的一个重要应用方向。”但是作为一家芯片公司,英特尔的计划和重点将和其他公司有所不同。“现在英特尔需要了解或者预测这些蓬勃发展的人工智能是怎么来影响硬件发展的,”宋继强解释说,“这就要求我们的产品和研究方向一方面能为承载在上面的平台降低功耗,另一方面还要提升计算能力。”
“了解”人类的机器人
正式成立于2009年的英特尔中国研究院位于北京中关村的一座写字楼里,前身是英特尔中国研究中心。宋继强则是在这之前的2008年加入的,担任清华大学-英特尔先进移动计算联合中心应用研发总监。在办公区的一旁,一处几十平方米的房间被放置进了沙发、电视以及双人床,这里被模拟成寻常家庭环境。时常有研究院的工程师在里面对简陋的机器人原型进行调整和测试。
这家英特尔最为年轻的研究院最初只能接受美国研究院决定的项目。彼时,英特尔正在做出一切努力,试图在移动市场获得与在个人电脑领域一样的成就。但直到最近几年,英特尔才意识到自己已经真正错失了移动市场的机会。在移动芯片领域,英特尔曾经展开过一段长达10年的追逐和努力,甚至在2014年重金投资和补贴平板电脑芯片,但是迎面却遭遇台积电和三星的迅猛崛起,这让英特尔在这一领域难以获得起色。2014年,英特尔首席财务官(CFO)斯塔西。史密斯(Stacy Smith)曾表示:“错过了平板电脑的浪潮,这令我们无比羞愧。英特尔目前正在寻找最新的趋势——甚至要赶在我们知道某个市场形成之前找到这种趋势。” 英特尔在2015年年初公布的2014年财报数据显示,公司移动通信业务在2014年全年的亏损额达到了42.1亿美元,这是继2013年亏损31.5亿美元之后,英特尔再次经历更巨大的亏损。
现在,这家公司似乎认为自己把握到了“最新趋势”的脉搏,并开始积极转型。在去年的一次分析师会议上,英特尔CEO科再奇(Brian Krzanich)曾说:“英特尔的营收和60%的利润已经来自于个人电脑以外的业务,我们的转型已经取得了一定的进展。现在是时候加速这种转型,把整个公司往新的方向一路推过去了。”他表示,英特尔必须从芯片公司加速转型为一家支持云计算、智能互联计算设备的公司。
如今的智能互联设备除了包括个人电脑和智能手机外,还包括机器人、无人机,以及各种可穿戴设备。这些设备上内嵌的芯片正成为英特尔转型过程中的一个新市场。但是宋继强最为看好的则是家用服务机器人的发展。“在技术发展到一定程度后,机器人的价格会迅速下降。未来人类家庭中,应该不止会存在一个机器人。”他说。这曾经是科技产品发展过程中屡试不爽的规律。
而想要提早抢占家用服务机器人这一未来趋势的制高点,英特尔必须依赖公司全球6家研究院研发力量的支持。其中的中国研究院正在把机器人识别算法研究作为自己的突破重点,“我们现在已经确定了能够识别1000种物体的算法是什么。进一步要研究如何让机器人理解人和环境,做出决定并反馈给人。”宋继强说。而基于这些庞杂算法之上的芯片研究则会移交给美国研究院负责。“把这些算法转化成芯片所需要的、用来验证和改写硬件逻辑的代码的工作,需要英特尔美国研究院继续跟进,因为做芯片并不是我们(中国研究院)的强项。”宋继强对《商业周刊/中文版》说。
纵然有研究院之间的协作,英特尔关于机器人系统的研究也必将经历一段“艰难”岁月。宋继强认为,机器人要想真正实现智能化,一定要有能力完成不同种类的计算,例如实时响应计算、多进程计算等等,这些计算需要协调视觉、认知、感知等多方面的数据。单单在协调视觉认知和感知方面,一个合格的机器人就需要“非常了解人类”。“比如一款提供老年人看护服务的机器人,理想状态应该是能够通过对人类长期的观察去了解他的状态,最终综合分析对方是否有老年痴呆症或者抑郁症的早期症状。”宋继强说。目前,利用包括英特尔中国研究院研发的视觉识别算法在内的几种技术组合,机器人已经能成功判断出人在家庭中的大体状态:是走来走去,还是坐在沙发上,或者躺在床上。
现在,中国研究院的研究人员已经开始和产品部门密切合作,研究院会收到来自产品部门的研发需求与合作请求。而在研究院里的机器人原型验证一旦达标,也将再被送到产品部门,由后者考量产品具体形态、应用场景等因素。“中国研究院里有50%的研究人员会跟产品组的研究方向紧密挂钩,而另外50%的人则会参与到风险程度更高的项目中。”宋继强说。
迎头赶上的英特尔
虽然包括机器人在内的智能平台被英特尔看作是下一个将要爆发的计算平台,但是对于机器人到底需要什么样的芯片,在宋继强这里似乎还不能给出一个确切的答案:“未来的机器人芯片也许需要好几种。因为机器人将是一个很综合性的平台,它们既需要处理视觉、触觉等传感融合的芯片,又需要控制机电一体化的芯片。”
在2014年的CES(International Consumer Electronics Show,国际消费类电子产品展览会)展会上,科再奇展示的只有一张邮票大小的芯片Edison,就是来自于英特尔中国研究院的研发成果。当时还没有升任院长的宋继强则是这一芯片研发过程中的主导者之一。“我们当时想要做的就是一个足够小的通用计算平台,将它插进任何一个不智能的设备上时,这个设备就可以智能起来。”宋继强说。这一最终产品化的芯片后来被应用在扫地机器人、智能相机、3d打印机等一系列智能产品上。今年IDF上那款陪护机器人原型的头部就内嵌了这种芯片,用于实现麦克风的功能作用。
“现在我们看到的机器人芯片计算能力并不完美,”Ninebot机器人副总裁蒲立表示,“一定程度上,PC上曾出现的现象正在机器人上重现。从前大家先有了一台PC,但是紧接着就出现一些更高性能的应用软件把这些芯片功能都‘吃掉’(消耗)了。在机器人上也是一样,应用需求和软件硬件的升级也会‘吃掉’芯片。”
目前使用的是英特尔的Atom芯片。在2016年年初的CES上,一台Ninebot公司研发的、由平衡车改造而成的家用服务机器人被科再奇介绍出场,这款被命名为“Segway Robot”的机器人可以跟在发令者的身后移动,也能帮助人类拎起重物,甚至还能观察出究竟是谁触发了门口的警报器。
英特尔正在进军的人工智能芯片市场风险巨大,包括英伟达、高通和IBM在内的公司已经开始同英特尔争夺订单。其中,高通提出了Zeroth技术,可以在一个芯片上运行神经网络,能利用手机中的数字信号处理器提供图像识别功能。IBM则希望开发一款模拟人脑功能的芯片,可以在智能手机上完成人工智能任务。今年4月,英伟达首席执行官黄仁勋公布了最新款的专门用于人工智能研究领域的Tesla P100图形处理芯片,他号称在这款GPU(Graphics Processing Unit,图形处理器)的开发上,英伟达花费了20亿美元的研发费用。而Facebook人工智能实验室的负责人Yann LeCun则在随后的媒体采访中表示,英伟达的GPU正在加速人工智能的发展进程。
这意味着英特尔需要与时间展开赛跑。在芯片在线社区里,英特尔一直被诟病没有完整的深度学习产品布局。一个芯片的制作周期往往长达18个月,这期间需要大量研发人员把相关算法和应用的稳定性作为目标进行努力。而半导体研究公司TiriasResearch首席分析师吉姆。麦克格雷格(Jim McGregor)在接受媒体采访时表示:在芯片产业,厂商必须提前2至4年规划新产品,因此必须提前判断哪些是关键应用。“英特尔错过了手机,不想再错过人工智能。” 吉姆。麦克格雷格说。
“如果在服务机器人时代真正到来的那天,英特尔跟不上,那就有大麻烦了。”宋继强正在感受这一趋势为英特尔带来的紧迫性。所以,他在英特尔中国研究院里开始鼓励工程师们按照自己感兴趣的方向参与到快速创新中。每年,中国研究院都有一批研究项目被英特尔全球研究院的“Research Velocity Challenge”项目选中。“这个项目是对大家研究速度的挑战。每半年一次,召集全球研究员参与。参与者的想法可以是冒险的,也可以是很大胆——甚至是不能实现的想法。”宋继强说。接下来,这些被选中的项目将被给予8个月到1年的时间和资金等待原型被验证,最终将被带到全球研究院管理层面前做演示。
“在这里,我们允许有失败的研究。因为这也是一种成果,验证了哪些方向是走不通的。英特尔研究院里的要求就是‘work for the future’,也就是为英特尔的下一步、两年以后的增长提供动力。”宋继强说,“我们需要和国际上的研究热点保持一致,而且还要尽量做到领先。总不能让Facebook的专家来告诉我们人工智能或者机器人是怎么回事。”