《通用人工智能》(2)

http://video.dushuren123.com/lecture-1395645872.mp4

王培
查看全部 内容介绍:
收起 内容介绍:

 

 

 

我认为智能是一个一般的信息加工原则,它的概念就是非公理化。我是希望去找一般意义下的思维规律,如果我们能找到这种规律,我们可能会发现智能不仅仅在人脑当中能体现,在其他方面也能有体现

 

 

按照我个人的观点,我自己做的系统当然是在AGI的范畴下,也就是这个绿线的模式。按我的观点蓝线的模式是完全没有智能的。它可以是一个很好的工具,但是它没有智能。机器学习这个东西当然是有智能的,但是智能水平相对来说是比较低的。我们希望做高品质,达到人类水平的人工智能。这也是我下面要解释的。对于“超人水平”,起码基于我看到的那些论证,我觉得都是有一些根本性的不能够成立的假设。这个是不同的人工智能的类型。

 

下面要转到我自己的工作了。当然也只是从基本概念上讲。首先又是给大家看一张图,我觉得这样可能会比较容易理解一些。我觉得实际上在人类智能这个概念之上有一个更抽象、更一般的智能的概念。当然这个观点也不是我一个人的观点。实际上在人工智能领域,尤其在早期的人工智能中好多人是持这种观点的。就是说我们人类的智能只不过是智能的一种存在形式,而我们在计算机上很可能可以找到另外一种存在形式。我这个图里面还包括了其他几种大家谈到过的存在形式,比如说动物。我们认为好多动物有一定程度的智能。还有一个就是群体智能,就是有时候一群人或者一个公司、一个国家、一支军队、一个团体在某种程度上可以被当做一个系统来看,然后我们可以讨论这个系统的智能。这个也是有意义的一个讨论问题的方式,而不是简单的一个比喻。最后一个问题就是在外星是不是有可能有智能生物?我觉得现在没有人能说这个事不可能。那么如果你承认这种可能性,那你就认为智能这个概念实际上不一定和人类的概念一定要捆绑在一起。我是希望去找所谓一般意义下的思维规律是什么?如果我们能找到这种规律,我们可能会发现这种规律不仅仅在人脑当中能体现,在刚才其他我提到的这几种方面也能有体现。我这个图像实际上是强调:人工智能和人类智能只在某一个抽象的层面上是类似或者等同的,它的具体表达形式很可能完全不一样。这个实际上是我在一定程度上追求的目标,就是说我希望我做出来的东西在某些方面跟人脑完全不一样,但是在另外一些方面又非常非常的一样。我觉得这才可能是真正抓住了智能的一般性,而不是说要求它的各个方面都尽可能的像人脑。

 

我认为智能是一个一般的信息加工原则。信息加工原则不仅仅是体现在人脑当中,也可以体现在其他系统当中。这个原则是什么呢?如果用一句话来表示:我认为智能是“一个系统在知识和资源相对不足的情况下适应环境的能力”。这里面实际上强调了两点,第一点就是相对不足,相对于什么不足?相对你要干的事情要解决的问题而言,你的知识和资源总是不够用的。我觉得智能系统一定是在这个环境下能够工作的系统。什么叫不够用?比如说你的硬件能力是有限的。你每一秒钟能想多少事情是有限制的。不管你的大脑是用什么材料做的,它能记多少东西是有限的。你不可能有无限的记忆能力。然后另外一个方面呢?你要完成的任务本身是有时间要求的。你说行,既然我的硬件能力有限,那我慢慢想吧。这是不行的,因为问题本身是有时效性的,比如有好多问题必须在某个时间之间完成才有意义,另外还有好多问题是要求尽快完成的,这个时间压力就更大了,所以你必须要考虑这种事情,不能说我就慢慢想想到多少算多少。这然后任务的内容也是没有限制的。实际上就跟我们前面讲的通用性有关系。你不能说我这个系统设计出来就是下围棋的。我可能会提出一些挑战性的或者带有创造性要求的任务,就是说我知道这个事情是超出你现有的能力的,但是你还是应该去试一下。这个我觉得才能算是有智能,而不是说我这个系统里面做了280个程序我就只能解决这280个问题,第281个问题我没有程序不知道怎么做。那个情况是没有智能的表现。

 

在这种情况下应该怎么做呢?这就是我这里面提到的另外一个概念,就是适应性。什么叫适应性?我觉得实际上恰好是对这个问题的应对。适应性就是说未来你不知道但是在一定程度上你知道过去,你要尽可能用你的过去引导你对未来的预测和你对目前的情况的应对。这就是我所谓的依靠过去来应对未来。因为未来和过去是不一样的,那你就有可能错,但是你的预测也不是乱做的,你还是有根据的。另外一方面就是资源的问题,我们在这个讨论下谈资源主要谈的是计算的资源,就是指时间和空间,你解决问题所需要的时间和你的系统的存储所需要的空间。我前面已经讲了,对任何一个系统来说时间和空间都是有限的。光是有限的而且还是不够用的。那么在这种情况下可以认为你的资源需求相对于你的供给来说差不多是无限,就是不管你现在有多少总还是不够的,总是要得更多。在这种情况下适应是什么意思?实际它的意思就是说你总能尽可能好的用你已有的资源去满足你未来的要求。所以从比较高的观点上来说,这个是我希望做的事情。我希望找到这样的一套规律,然后做到计算机系统里面,让它也可以在这种情况下工作。

 

这里面核心的概念显然就是所谓的非公理化。传统的、绝大多数的推理系统是公理化系统。是什么意思呢?就是说它从一些我们叫做公理的基本前提出发,公理的意思就是说我承认它是真的,我不怀疑它的真理性,根据公理再从其中推出一些定理来。定理的真理性是由公理和推理规则的保真性来保障的。意思就是说,如果你承认我前面的这几条,那你就必须承认我后面推出来的这些东西,所以整个活动就是从真理推出新的真理的一个过程。那么我的非公理化显然是挑战了这个假设,我是说在我的这个系统里面没有公理这个东西,或者可以说没有绝对真理这个东西,就是所有东西都有可能是错的。那么如果这个是我的基本假设,在这种系统里面是不是就是公说公有理婆说婆有理一切怎么做都行了呢?因为反正你也没办法说这是一个真理。其实这种观点是不对的,这里面还是有一个合理性的标准,但是这个合理性的标准不是传统意义下的真理标准。因为你没办法保证那个标准是正确的,我不是说那个标准不好,我是说做不到它。

 

那么我刚才说的在这种情况下的合理性或者合乎逻辑是什么呢?是在你现有的资源知识的约束下你能做到的最好。比如猜明天的天气,谁也不可能百分百的猜准。但是如果你的猜测是根据以往的气象资料然后用很复杂的模型推演出来的,那么大家就觉得你这个推测更靠谱一点。另外一个人纯粹就是拍脑袋,就觉得明天不会下雨,那么大家就觉得他的推断不是那么靠谱。当然不能够排除明天恰好他对了你错了这个现象,但是我们仍然会说你的推测有道理,他的没道理。所以最后不是以成败论英雄的,是以你这个推测是不是充分的利用了你现有的知识和资源来做评判的。所以我现在做纳思是想做出这样一个东西来。这个系统我已经做了很多年,已经是把它用形式化的、数学化的办法描述了,而且是在计算机上实现了,最近这些年做成了一个开源系统。我有一个团队在帮忙做这个事情。当然这个系统远远没有完成,但是我们有一个可以工作的演示,实际上有若干个版本。这个系统现有的基本想法跟现在很火的神经元网络最大的差别是什么呢?在于我也是模拟人的思维活动,但是我不是在神经元层面上模拟的,我是在概念层面上模拟人的思维活动或者试图再现人的思维模式。这个概念在我系统当中的名字叫做“词项”,或者叫做概念或系统内部的标识符。词项之间的联系就可以构成陈述。用语言学的术语来说,最典型、最简单的陈述就是一个主项一个谓项中间用一个系动词连着。有一个例子,比如说乌鸦是鸟,或者说乌鸦是一种鸟,那么在这里面“乌鸦”和“鸟”各是一个词项。“是一种”是系动词。可以把它画成一个图来表示,在这里面乌鸦是一个点,鸟是另外一个点,然后从乌鸦这个点到鸟这个点有一个箭头指过去,就是代表乌鸦是一种鸟。箭头这个系动词我把它叫做“继承系词”,它有一些逻辑上的特征。最典型的、理想的情况下它是逻辑学上自返的和传递的关系。“自返”就是说鸟是一种鸟,任何东西都是它自己,这是同一性。“传递性”就是如果abbc,那么a就是c。在我这里面就是,如果你说乌鸦是一种鸟,鸟是一种动物,那么你就可以说乌鸦是一种动物,这个是大家一般推理当中都遵循的原则。

 

这肯定不是一个简单的二值逻辑,就是说不是每一句话都简单的是真或者假的问题,而是说它是在一定程度上为真,所以说“真”是一个程度的问题。而它的程度是跟什么的关系呢?是跟它现有证据的关系。就是说你现有的证据在多大程度上支持你这个结论。我这里面又有一个图,比如说我们现在要考察从词项s到词项p之间的继承关系在多大程度上成立。那么我们首先要去考虑对于这个陈述来说哪些东西叫做证据?哪些东西是支持它的证据?哪些东西是反对它的证据?这个图上有一些其他的词项,那些绿的有一个加号的词项就是正面的证据,那些红的有个减号的是反面的证据。如果没有合适减号的话,有个乘号的是反面的证据。举个例子,比如说我们说“鸟会飞”这个命题,如果你看见一个鸟而且也确实会飞,那么这个鸟就为“鸟会飞”提供了正面的证据。如果你看见一个鸟不会飞,那么它就为“鸟会飞”提供了一个反面的证据。这就是一个简单的思路。总之最后对于“鸟会飞”这个事情的看法或者相信程度是什么呢?我在这个系统当中是首先定义了什么是正面的证据,什么是反面的证据,然后什么是总证据,总证据无非就是正面和反面加起来。在这个基础上我给了它一个测量,实际上我是用两个数组成的一个对来叫做这个系统的“真值”,这两个数在这里面用fc来表示,ffrequency,是频率的意思,cconfidence,是可信度的意思。频率大家容易理解,无非就是你的现有的证据里面百分多少是支持你的。像我刚刚说的鸟会飞,我如果看了100只鸟,80只会飞,20只不会飞,那这个频率就是80%。这个大家都可以接受。这很像概率但是严格的说它不是概率,因为学过概率论的都知道概率是相对频率取极限,而在我这个系统里是不取极限的。因为取极限就涉及到未来的事情,我现在假定不知道未来只知道我的已经看见的东西。

 

那么这就是第一个数的解释。第二个数是我的系统当中所独有的一个测度,这个“可信度”是什么呢?它是把你已经知道的东西和你不知道的东西来比。但是你不知道的东西是无穷的那要怎么比?我取出其中的一部分来比,我设一个常量的未来证据或者定义证据的一个单位,比如说我把我现有知道的所有的东西跟下一次观察来比,下一次观察会支持我还是会否定我,我不知道,但是我知道下一次观察是一次观察。我如果已经观察过一万次,那么下一次是支持我还是反对我其实没太大关系。如果我只观察过两次,那么下一次是支持我还是反对我的影响就很大了。可信度实际上是这么一个测度。

 

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!