最近,OpenAI透露,他们将在语言领域继续发力。该文的作者是Michael Kropivka,人工智能与机器学习资深研究员,AlgoBrainsLab的创始人和软件工程师。
这篇文章是关于发明一种与感知有关的语言的系统,它揭示了通过与人工语言相关的研究可能开启的可能性,至少这种语言将类似于动物典型的信号语言,更深层次的语言将演变成更复杂的技术。
世界上没有一种东西是像语言这样如此高度进化的。语言的使用能力也有所演变。这种能力出现在大约75000年前。这很简单。而我们今天所说的语言是我们的语言如何转变成口语行为。正如乔姆斯基所说,它是关于基本思维过程的次要语言。世界各地有大约6000种不同的语言。我们真正想要的是了解一个基本原则,使我们有能力获得这6000种语言的任何一种。并创建几个新的。
语言不光指必要的说话声音,还指更多的内在过程。它更接近一个思维过程。
语言在某种意义上类似视觉
从不同角度来看待物体的能力,与提问相关的细节或隐藏事实的能力其实是一样的。内部对话与想象的场景也同理。最有趣的部分是,两种能力在最低水平时,比平时都要接近。发现能够同时处理视觉和语言的系统是智力的基础。
最终目标是,通过视觉感知来形成一个识别现实的系统,然后创建抽象过程。此外,系统能够使用语言来进行抽象操作,目标是以人类思维方式连接抽象过程。
尽管语言和视觉是指头脑中相同的抽象概念,但所有抽象的来源都是现实,这就是为什么我们用最简单的视觉对象而不是语言来掌握抽象过程。之后,语言描述的对象变得与我们看到的一样真实。但是,如果没有机器与物理世界的交互,就无法掌握人类语言。这就是为什么OpenAI承诺要学会交流策略的原因所在。
进行这种研究的另一个原因是,目前将机器人置于物理世界中来学习整个环境的可能性是很小的,这需要花太多的时间。因此,通过静态数据获取语言是不可能的。唯一的办法就是要积极参与到环境中。此外,利用人类思维去进行回避实验是很难的,所以计算机模拟成为21世纪语言学研究工具的最佳候选。
我们的目标是创建一个了解我们的智能agent,这是非常困难的问题,自1960年以来,我们一直在研究。但是,我们还没有能够正式地去描述一种语言,因为没有语境,语言就是不存在的,环境就是这样的语境。
竞争与合作
我们已经看到,一个能够在强化学习实验中表现出令人敬畏的结果的系统,它就是利用DeepMind Q leaning来玩Atari游戏。简而言之,系统有相对应的环境和agent(机器玩家)来获得分数,并且agent(机器玩家)成功地学会了如何玩得更好。
图:arxiv
AlphaGo是另一个突破,关键的区别在于游戏背后有一个对手。此外,游戏环境还有多种场景。值得一提的优秀解决方案是agent(机器玩家)与自己的副本在玩。
下一步将是agent(机器玩家)能够找到一种彼此合作的方式,来实现额外的价值。OpenAI研究显示,智能agent在一个完全不同的环境中表现的很好——像人类这样的相互合作的世界。
黑箱问题
内部语言会是下一个突破,以帮助管理机器学习(ML)框架的复杂性。今天我们必须付出很多努力来解释什么是ML系统,ML系统正在做什么以及为什么要这么做。 最接近人类的语言是即将到来的与ML引擎一起工作的接口。对于多用途agent,这种语言是定义目标函数的最佳方式。
实际上,随着人工智能系统的复杂性越来越高,很难设想如何在没有语言的情况下与他们进行协作,而不用提出问题,也不用问他们“为什么”。而且,毫不费力地与电脑进行交流的能力将使他们无限有用。—— Will Knight
语言本身
除了基本结构和词汇差异,我们可以通过相同的术语来描述英语和中文:名词、动词、助词、时态等。这两种语言都是由数以千计的沟通思想在包围的现实之上创造出来的。
图:8020Japanese 日语句子结构背后的逻辑非常简单。
想象两个人分别使用英文和中文,他们除了用母语聊天以外没有其他方式可以交流。在这种情况下,他们没有选择去学习对方的语言。但是想象一下他们已经见面了,马上学习对方语言其实并不复杂。是什么改变了他们?他们有一个被包围的环境,他们能够用一种新语言与环境结合,婴儿就是以相同的方式学习语言的。
语言游戏
这篇文章不能不提到Ludwig Wittgenstein创立的语言游戏。我们来看一下参考维基百科的描述:
该语言用于建筑师A和助理B之间的沟通,A正在用建筑石材施工:有木块、圆柱、厚板和横梁。 B必须按照A需要的顺序递石材。为此,他们使用由“块(block)”、“柱(pillar)”、“板(slab)”、“梁(beam)”组成的语言。A说出他需要的石材种类,B把他听到的挑出来递给A。想象一下这是个完整的原始语言。
后来添加了“this”和“there”(功能类似于这些单词在自然语言中的功能),“a、b、c、d”作为数字。其使用的一个例子:建筑师A说“d-板-在那里”并且指出来,建筑师B数四个板,“a、b、c、d ...”,并将它们移动到A指向的地方。建筑师的语言是一种活动,它被编织成我们将认可为语言的东西,但是以更简单的形式。这种语言游戏类似于向儿童传授的简单形式的语言,而维特根斯坦(Wittgenstein)则认为,我们将其视为建筑者部落的“完整原始语言”。
所以,OpenAI的研究是迈向创建一个将自己适应和融入与人合作的agent。每个这样的合作可以被定义为语言游戏。
结论
我们从“seeds”开始,在培育智能系统的道路上迈出了一步,这些“seeds”就是前置条件和算法。另外,seeds是清晰并可感知的,而最终的系统是强大的、难以理解的。而且几种seeds的组合最终将导致更强大的智能机器,并最终实现通用人工智能(AGI)。“学习交流”是深度强化学习、Q-learning、蒙特卡洛规划等的另一“seed”。
然而,我们不知道如何从大脑中复制有价值的工作原理,我们通过尝试和模拟各种方式和方法。虽然,本身并没有一个有形的意识,但是我们正在建设具有沟通能力的新框架的路上前行。