我们现在认为知识是一个生态过程,经过大量信息的观察、归纳、抽象、提炼,表示为知识。知识不是固定的。站在比原来三大学派更本质、更高的立场上来研究人工智能的理论,就建立了信息-知识智能转换的理论。
第二个理论就是知识的理论。关于知识理论现有的理论有两个,一个是上世纪70年代斯坦福大学的一个学者叫Feigenbaum(费根鲍姆)提出了一个知识工程。这个知识工程就讲这个知识怎么表示,怎么样去推理;第二个知识理论就是到了90年代有一批学者研究网络上存在的——因为那时候网络已经很发达了——大量的知识、大量的信息,那么怎么从这个网络上的信息当中去提炼知识呢?这就是知识的发现,有的人也叫做数据的挖掘。
因为数据库存在着,网络把大量的数据库、成亿成亿的数据库连在一起,就变成了一个数据很丰富的一个系统。怎么样从这里头去提炼出共性的知识来,所以最初叫做数据挖掘。想从数据当中挖掘出共性的知识来,后面也把它叫做知识的挖掘、知识的发现。所以这两个名字有一点差别,但是大致上都是讲怎么样从数据提炼知识。你叫数据挖掘也可以,你叫知识发现也可以。基本上是这样一个过程,当然有一点不同,着眼点不同,处理当中关于知识的提炼,有一点后面的处理不同,总体上是我们现在比较喜欢叫知识的发现。
这两个理论已经存在了, 70年代 90年代提出来发展到今天,已经都存在了。但是现在的知识跟问题,就是这两个知识理论互相之间没有联系,不能沟通。不是不能沟通,是没有沟通,是孤立的。刚才我们再三讲“碎片化、孤岛化”,信息理论就只有一个信息理论,这也是一个孤岛,没有别的大家认可的信息理论。知识理论有两个不同的知识,也是孤岛,这个知识跟那个知识没有连通,没有统一,没有沟通,所以也是碎片化。这就是现状,已有的知识状态。
我们的知识理论跟这个就不一样了,我们提出了一个叫知识的生态学。刚才讲知识,我们现在认为知识是一个生态过程,经过大量信息的观察、归纳、抽象、提炼,表示为知识。这是一个观点,就是知识不是固定的,不是说这个知识是天生的或者这个知识就是大百科里头来的,那你问大百科的知识怎么来的,当然是人慢慢慢慢地(积累)。人的知识又是从哪儿来的?是最初从信息、大量同类事物的信息观察之后发现它们的共性提炼出来的,是这么来的。所以知识不是一个稳定的东西,不是一个封闭的东西,不是一个孤立的东西,它是一个生态的过程。这个是我们的一个基本的理论。
知识它的生态有两个表现,一个是知识外部,知识外部这边是从信息产生出来的,另外一边呢,这个知识可以被人们加工成为智能,知识来源于信息,被加工为智能,这是它的外部表现出来的。第二个知识的内部也有一个生态过程,这个内部生态过程就表现为这个模型,就是知识它内部也是一个生长过程,最初从信息提炼出知识的时候,最初的阶段是一个经验性的,不成熟的,可能再看,再多一点信息样本,这个经验知识可能就会更完善一点。所以它有一个完善化的过程,这个知识咱们讲不成熟,经验性,这是一个状态,然后经过人们不断地对它修改、补充、完善化,它就会生长出比较成熟的,就叫做规范化知识。所以这个知识从经验状态生长到规范状态,这也是一个生长过程。
另外还有一个过程,就是这两种知识当中,有一些比较普适的,那种常识性的知识,所以这两种知识会成长成为过成熟的常识知识。比方说太阳从东边起来西边落下,这个是现象,慢慢变成我们的经验性的知识,这个知识慢慢就会变成常识,人人都知道,用不着教,用不着去证明,这个是无师自通,天天看见,上来下去、上来下去天天如此,所以就变成常识了。
还有一种规范化的知识也会沉淀为常识。比方说几何学当中的两根平行线在欧几里得空间当中永远都不相交,平行线一直走下去,不知道什么地方能相交,不能相交,距离是一样,哪里都一样的,这个是一个理论,是一个几何学的理论。但是随着科学知识的普及,慢慢发展,人人都知道,这两个东西平行的话是不会相交的,就变成一个常识。所以经验性知识可以生长成为规范化的知识,而经验性知识跟规范性知识都有可能成长成为常识性的知识。
常识度不断地加强,由欠成熟到成熟到过成熟或者叫超成熟,这个程式知识就是过成熟,成熟的不得了了,人人都皆知了,不需要证明了。这样是知识成长内部有这样一个由不成熟到成熟到过成熟的生长过程,外部有从信息到知识到智能的生长过程。这些都是知识当中非常重要的一些规律,已有的知识理论都没有研究这个,所以它那两个知识理论都不能沟通。而用知识生态学当然就好沟通,知识工程跟发现的知识经过处理就可以用一定方式来表达,然后可以进行用一定的数学工具来演绎,这样它就可以统一起来,这是知识理论也有这么一个发展,也有这么一个重新构造。
第三个理论就是智能理论,现在有三种。一个就是模拟人脑结构的人工神经网络,这有一大套理论,从最早的感知机和最早的单一的神经元的理论到感知机的理论
到前馈的神经网络,反馈的神经网络,一直到今天还在发展,而且很引人瞩目的深度神经网络,用它来做深度学习等等,这是一套理论。
第二套理论就是功能模拟的理论,这个就是物理符号系统,后来就变成了专家系统。这个物理符号系统意思就是说,我用计算机做平台,你只要提出问题,我就针对你的问题编一个聪明的程序——所谓的聪明程序——我就可以去解决你这个问题,而且那个问题可以是任何问题通用问题,所以最早的时候叫做通用问题求解算法,General problem solver。后来发现真的不可能做到通用问题求解,因为你对任何一个问题求解,都需要跟这个问题相关的知识,你能够做到万能吗?
以前我们把钱伟长——清华大学后来到上海大学当校长——叫做万能科学家,因为他懂力学、懂物理,然后物理比较全面了,当中特别对力学精通,然后他又演绎到物理学,相邻的其他的学科也有很多见解,包括天体,包括很多东西,所以把他叫做万能科学家。其实钱先生也是若干个领域,也不能够说是万能,达到万能的人大概是不存在的。所以想要通用问题求解,实际上是不可能的。因为你的知识没有那么多,哪怕计算机把你的知识存进去,把他的知识把全人类的知识都存进去,理论上是可以做的,实际上是不可行的。你怎么可能把全世界的知识,所有人的知识都存到这里来,没有办法操作,理论上可以这么去想,实际上做不到。
所以后来就把这个通用问题求解收缩起来变成一个面对专门领域问题的人工智能系统,简称为专家系统,意思就是说在这个专门领域,我们这个人工智能系统要做到,这个专门领域的专家的水平,显出来它的智能了。有一套理论一直到今天,基本上就是专家系统理论,包括刚才提到过的基于深度神经网络来做成的围棋博弈的人工智能系统Alpha Go,这是专家系统的一个最新的成果,因此也有一大套理论。
第三个就是行为主义,模拟有什么刺激我就产生什么响应,能够看得见的一些行为,这样也有一套理论,包括现在的机器人,怎么设计机器人,对什么问题能够接受它的响应,产生我的作用、行为。问题在于这三套理论沟通不了,就是分而治之这个方法论带来的恶果。在局部里头很行使,能做出很多花样,好像可以解决很多问题,但是这三个东西不能沟通,不能形成一个完整的,威力真正强大的一个人工智能系统。
因此现有的理论最大的问题还是因为分而治之这个方法论造成的很明显的局限性,碎片化,互不沟通。我们的智能理论用信息生态这样一种方法论去研究生态过程它的机制是什么发现了要从外部事物的客体信息,慢慢变成了感知信息,变成了知识,变成了智能策略,变成了智能行为,这样来产生智能。
如果这个智能行为不完善,我又把这个不完善作为一个新的信息去补充我的知识,优化我的策略,更好地来解决问题。如果还不够,
再来一次,每一次都比上一次更好,这个就是我们的智能理论,叫做智能生成机制。立足于这个智能生成机制建立的智能理论就叫做机制主义的人工智能理论。前面那三种一个叫做结构主义的人工智能理论,一个叫做功能主义的人工智能理论,第三种叫做行为主义的人工智能理论。
刚才我们分析了结构的也好,功能的也好,行为的也好,都不是本质,本质而且统筹全局的要害关键灵魂,是机制。任何一个问题来了,一个客体信息来了,我利用这个机制,我都能够把它演绎、推理、转换,最后成为智能行为反作用于它。这个机制要实现的话,在这个问题下可能要这样的结构,在那个问题下可能要那个结构,所以结构是服务于机制的。在这个情况下可能需要这么多功能,到那个可能就只要这么多的功能,所以结构、功能都是服务于机制的,这个是最根本的。
那我们就站在了比原来三大学派更本质、更高的一个解决问题的立场上来研究人工智能的理论到底怎么建立,这样就建立了这个机制叫做信息知识智能转换的理论。以这个作为人工智能的机制,这个理论建立起来以后,特别有意思的是我们当初研究这个只是说结构、功能、行为都不够本质,都是局部的东西,真正统管全局的是机制,并没有想到这个机制主义的人工理论能不能把那三个东西统一起来。
下棋看三步四步可以,看八步九步大概就比较难了。我们当初也是,那三条路走得都不对,不是完全错,但是是不够的,不够高、不够到位,所以我们要走一条新路,走机制主义。真正把机制主义这样一个人工智能理论深入地展开发现结构主义的人工智能理论,功能主义的人工智能理论,行为主义的人工智能理论原来就是机制主义人工智能理论的三段。
因为现在看来很简单,当初觉得很复杂,这张PPT就可以看得出来!
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!