偏离AGI目标?OpenAI解散机器人团队!曾研发解魔方机械手

智东西(公众号:zhidxcom)
作者 | 杨畅
编辑 | Panken

智东西7月19日消息,据外媒VentureBeat报道,当地时间6月3号,全球顶尖人工智能研究机构OpenAI联合创始人Wojciech Zaremba透露,OpenAI已经解散了其机器人团队,将注意力转移到其他更容易获取数据的领域。有公司发言人称机器人团队解散时间是去年10月。

根据Zaremba的说法,OpenAI最初开展机器人研究是为了帮助他们公司通用人工智能方面发展,推进强化学习技术水平,OpenAI选择解散机器人团队对公司更有利,他们发现有其他研究方法可以使强化学习研究取得更快的进展。

偏离AGI目标?OpenAI解散机器人团队!曾研发解魔方机械手

▲屏幕右侧为OpenAI联合创始人Wojciech Zaremba,他说OpenAI解散了其机器人团队

访谈视频地址:

https://www.youtube.com/watch?v=429QC4Yl-mA&t=1153s

一、曾研发能解魔方的机械手

公司联合创始人Zaremba是在由美国初创公司Weights &Bias主持的播客上,透露其机器人团队解散这个消息。

Zaremba说:“事实证明,当我们利用数据时,我们能够取得巨大的进步,然后机器学习、无监督学习和强化学习工作得更好了。很多领域都需要极其丰富的数据,这最终阻碍了机器人技术方面的发展。‘解散机器人团队’的决定对于我自己来说是相当艰难的,但我前一段时间意识到,实际上,从公司角度来看这样做是最好的。”

在一份声明中,OpenAI的一位发言人告诉VentureBeat:“在公司通过魔方项目和其他项目推进强化学习技术水平一段时间之后,去年10月份我们决定不再继续更多的机器人研究,转而将团队的重点移到其他项目上。因为人工智能及其能力的快速发展,我们发现了其他方法,例如基于人类反馈的强化学习,将加快我们强化学习的研究进展。”

在OpenAI解散机器人团队之前,他们已经进行了好几年的机器人研究。

早在2017年,OpenAI发布过一个机器人仿真控制开源软件Roboschool。同年,它开发出了一个机器人系统,在模拟环境中彻底地训练这个系统,并将其部署到一个实体机器人身上。这个机器人看一遍这个新任务怎么做,就能学会它。

OpenAI在2018年研究出了可用的模拟机器人环境和能从失败中学习的强化学习算法HER(Hindsight Experience Replay)。

2019年10月,OpenAI首次大范围的展示了它在机器人方面的工作情况,在一项研究中,详细介绍其设计五指机械手,其中内置人工智能模型来引导机械手运动。

当时,表现最好的系统模型解开魔方的成功率约为20%到60%,似乎不是特别令人瞩目。但值得注意的,研究人员增加难度,如绑住机械手手指或者给机械手戴上皮手套时,机械手仍能解开魔方。

偏离AGI目标?OpenAI解散机器人团队!曾研发解魔方机械手

▲机器手在戴上皮手套并用绑带绑住的情况下解魔方

二、解散团队或因偏离AGI目标

如果OpenAI是一家机器人公司,那么它的公司使命会与现在不同,在这样的假设下,Zaremba认为公司会继续大力发展机器人业务。

“但从我们公司想要实现的目标——通用人工智能(AGI)角度来看,有一些业务部分要失去。”他谈道。

OpenAI长期以来一直宣称,庞大的算力是迈向AGI的必要一步,或者人工智能可学习人类能够完成的任务。当初进行机器人研究也是为了促进AGI方面的发展。

当加拿大蒙特利尔学习算法研究所(Montreal Institute of Learning Algorithms,Mila)创始人Yoshua Bengio和Facebook副总裁兼首席人工智能科学家Yann LeCun等名人认为AGI不存在时,OpenAI的联合创始人和赞助人,包括Greg Brockman、首席科学家Ilya Sutskever、Elon Musk、Reid Hoffman和美国Y Combinator前总裁Sam Altman等,都相信强大的计算机结合强化学习、预训练和其他技术可以实现颠覆范式的人工智能的进步。

除了利用解魔方机器人来推进强化学习之外,据MIT Technology Review 2020年报道,OpenAI的Foresight团队还开展过一项实验,测试他们通过越来越多大量的数据和计算去训练算法,能把人工智能的能力推进到什么程度。

这份报道还指出,OpenAI正在使用大量的计算资源开发一个训练图像、文本和其他数据的系统,该公司领导层认为这是实现AGI最有前途的路径。

OpenAI进行的这一努力的成果之一是DALL-E,一个文本到图像(text-to-image)的引擎,它本质上是一个视觉创意生成器。

偏离AGI目标?OpenAI解散机器人团队!曾研发解魔方机械手

▲DALL-E根据文本去合成图像

给定一个文本提示,OpenAI这个系统生成图像去匹配提示。当提示信息暗示图像必须包含一个没有明确说明的细节时,DALL-E就填充空白。DALL-E可用结合不同的想法来合成物体,其中一些合成物体不太可能在现实世界存在,比如蜗牛和竖琴的混合体。

相比DALL-E来说,目前机器人业务对于公司AGI发展目标来说,发挥作用可能有点慢。

Brockman和Altman特别相信,AGI将能够比任何一个人掌握的领域更多,这个的实现主要是通过识别人类专家难以发现的复杂的跨学科联系。此外,他们预测合理部署AGI,换句话说,通过AGI与社会科学等相关领域的研究人员的“密切合作”,可能会有助于解决气候变化、医疗保健和教育方面的长期挑战。

Zaremba说:“当我们创建机器人(系统)时,我们认为可以通过自生成(self-generated)数据和强化学习来取得很大进展。当时,我相信预训练让(增加)模型的‘智商点’便宜到原来的一百分之一。”

他补充道,在创建大型复杂的人工智能系统时,预训练是一种特别强大的技术。在高层次上,预训练有助于模型去学习一般的特征,这些特征可以在目标任务中重复使用,来提高模型准确性。

预训练被用来开发OpenAI的Codex模型,该模型经过数十亿行公共代码训练,以支持微软GitHub的Copilot服务,该服务为像Microsoft Visual Studio等开发环境中的整行代码提供建议。Codex是OpenAI GPT-3的一个微调版本,GPT-3是一种语言模型,它预先训练了来自网站、书籍、维基百科和其他网络资源的超过一万亿单词。

偏离AGI目标?OpenAI解散机器人团队!曾研发解魔方机械手

▲GPT-3网站主页

三、经济困境难解,和微软加深商业化合作

OpenAI放弃机器人业务,或许还与其面临的经济现实有关。

由于OpenAI是一家“非营利公司”,主要研发的又是“GPT-3”这样的烧钱机器,成本负担与日俱增。谷歌母公司Alphabet旗下顶尖AI研究公司DeepMind也承受着相似的入不敷出压力。

从前年起,OpenAI和它的投资者微软公司开始开展更多商业化方向的尝试。

2019年7月微软宣布将向总部位于旧金山的OpenAI投资10亿美元,以联合开发微软Azure云平台的新技术。作为交换,OpenAI同意将其部分知识产权授权给微软,然后微软将这些知识产权打包出售给合作伙伴,并在OpenAI开发下一代计算硬件时在Azure上训练和运行人工智能模型。

在接下来的几个月里,OpenAI发布了一个微软Azure支持的API,允许开发者探索GPT-3的功能。OpenAI指出GPT-3目前被“数万”开发者用于300多个不同的应用程序,每天产生45亿单词。到2020年底,微软宣布将独家授权给GPT-3,为客户开发和提供人工智能解决方案,并开发利用自然语言生成能力的新产品。

微软还宣布,GPT-3将与Power Apps“深度”集成,Power Apps是微软的低代码应用开发平台,专门用于生成公式。例如,人工智能功能将允许用户构建一个电子商务应用,用对话语言(“查找名称以‘孩子’开头的产品”)描述一个编程目标。

至于像OpenAI进行的DALL-E和Jukebox这样的项目,它们也有明显和直接的商业应用。Jukebox是一种人工智能系统,可以从头开始生成任何风格的音乐,并配有人声。OpenAI预测DALL-E有一天会增强甚至取代3D渲染引擎。例如,建筑师可以使用该工具来可视化建筑,而图形艺术家可以将其应用于软件和电子游戏设计。

结语:成本压力下,多家明星机器人团队“退赛”

机器人行业是资本密集型行业,并且从研发到成熟再到商业化,一个团队需要很长时间才能打磨好一款机器人,但是投放到市场的效果是不可预期的。很多公司因为资金问题和商业化效果不佳,而走向倒闭的境地。

例如2018年10月美国工业机器人公司Rethink Robotics倒闭,其CEO Scott Eckert在一封信中就谈道,Rethink Robotics在工业机器人领域领先,但公司市场表现达不到预期,几款机器人销量远低于预期,导致现金流不足、公司倒闭。

不止Rethink Robotics,还有美国Anki机器人公司2019年4月最后一轮融资失败,然后破产。其创始人兼CEO Boris Sofman在一份声明中说,如果没有大量资金来支持Anki的硬件和软件业务,并为长期产品路线图架起桥梁的话,大家预期机器人驱动应用的未来根本不可能实现。目前,机器人行业发展还是任重而道远。

来源:VentureBeat、YouTube