“纳思”跟传统人工智能的一个大的差别就在于评判什么是真。在系统当中真假是跟已有的证据去比较的。它的意义不仅仅是由一个定义来刻画的,而是直接植根于它的经验和证据
在这个基础上我们可以说什么呢?我们可以看着下面这一张大一点的图说,我们可以把系统现在的信念看作一个概念的网络。这里面的每一个节点都是一个概念,我这里面也是用鸟这个例子,鸟是一个节点,天鹅是一个节点,海鸥是一个节点,乌鸦是一个节点,然后它们互相之间有联系。这个联系就是我刚才说的那种,什么东西是一种什么的继承关系。每个联系上面我标了两个数,就是我刚才定义的那个真值。所以图里面的这些黑的点和这些黑的线加在一起,基本上就直观的表达了在一个特定的时刻这个系统的现有的信念,在一个特定时刻的信念。然后我这里还有一些红的线,它代表系统的任务,就是说你系统总是要想些什么,你根据你已有的知识,你能想些什么呢?在我的系统当中,在这个最简单的模型下,它可以完成两类任务。一类任务,当然是你可以问它问题,比如说在我这里边上面这条红线上面有个问号,这是问它“知更鸟会不会游泳”?这个东西超出它现有的直接的经验的范围,但是它可以根据其他的经验进行推理来试图回答这个问题。比如说它实际上在我这个系统当中,在当前的信念网络下,它可以首先实际上是试图想,知更鸟这个东西是不是一种个鸟?这个如果是一个鸟的话,鸟会游泳的可能性有多大?它根据这些个推出这么一个结论来,当然它推出来的结论有可能是不对的。但是我们用这个真值可以来刻画,在多大程度上,它的结论是被它现有的证据所支持的,或者它是反对的。这是一类任务,还有一类任务就是我每次给它一个新的知识,显然会造成这个图上的边和节点的变化,我会增加一些新的概念,我会增加一些新的边,我也可能修改一些现有的边的真值。比如说现在另外一条红线,实际上就对应于它以前认为天鹅是会游泳的,但是它后来又得到一些新的证据,它他觉得新的证据表明说天鹅会游泳的可能性实际上很小。那么如果这两个东西都进入了它脑子里面,它会怎么想?它会整理它的经验,试图去得到一个总的概括性的答案。这个里面包括处理一些矛盾性的信息。那些不矛盾的信息分别累积起来,得到一些更强有力的信念。而在这个系统里面,首先有一个概念,那么我们说,实际上就是像我最底下说的鸟的这个概念,实际上它就是一个点,就是鸟的一个名字和跟它直接有关的这些信念的一个组合。
那么随着系统的学习过程或者推理的过程的发展,这个“鸟”的概念也会逐渐变化,这是我这个系统跟其他系统的一个大的差别。这个就是总结一下我刚才说的这里面,就是说在理论上我跟传统的工作的一个大的差别,就在于什么是“真”?这实际上就是转变成哲学的问题了。在这个系统当中传统的理论往往认为“真”真是一句话和世界当中事实的关系,符合事实就是真,不符合事实就是假。我觉得这个想法那个大概是个近似,在好多情况下可以这么想,但严格的说我觉得这个看法是不对的,不恰当的。在我这个系统当中,真假是跟你知道哪些东西有关系。你实际上你不是跟世界直接比较,而是你是跟你知道的,已有的证据去比较,是在这个意义上谈多大程度上为真。另外有关系的,还有一点就是说,一个词的意义是什么?这个也是跟传统的观点不一样,传统意义就比如说鸟,什么是鸟?那就是世界上那些鸟,你是用一个词去指称世界上存在的一些对象。我也不承认这个观点,我觉得按我的这个模型,刚才我已经提到了,实际上什么是鸟,是取决于你对于这个词知道一些什么,所以不同的人有不同的经验,虽然说他们生活在同一个世界里,但是他们大概对同个词的用法就很不一样。我这个模型就可以解释这一点,虽然说他们生活在同一个世界里。而且还有一点就是说,实际上它的意义不仅仅,不简单是由一个定义来刻画的,而是直接植根于它的经验,所以这就说明按照这个模型,这个真假的事情和词的意义,实际上都跟系统的经验发展和时间而变化,是随着时间而变化。当然这个变化不是任意的,当然它有可能也会逐渐的,有可能会趋渐于稳定,但是不能保证,一定最后一定会收敛到某一个特定的点上,这个是在技术上是我的研究跟现在机器学习的很大的技术上的差别。
另外,这样一个模型就使得我这个NARS系统可以统一的表达和处理各种的不确定性。这点是大家直观上所知道的,就是人脑和计算机的差别。计算机一般都要求你把东西都非常明确、非常稳定地确定下来,而人脑面对的情况往往不具有这种程序,而我这个模型可以统一的处理这种情况,比如说随机性,比如说模糊性,比如说无知怎么办?比如说你的知识有矛盾怎样办?比如说你的知识会改变,这时候怎么办?
下面简单讲一下推理规则。就是说我这个推理规则和传统的不一样,我不是从真理推出真理的。我的前提本身都已经有一定的不确定性了,那当然肯定结论就更不确定了。,但是由于前提的结合方式不一样,结论的不确定程度也不一样。而我这个实际在技术上实际上反而不是接近于现在的数理逻辑,反而是更接近于更古老的亚里士多德的三段论的逻辑。这个也是很有趣的一个现象。这些推理它既是关于这个前提的形式的,也是关于它的内容的,而且它可以保证前提和结论的相关性,这也是跟传统的数理逻辑很不一样的一点。而推理它最后实现了什么呢?它实际上是实现了词项可替换性的传递,就是我刚才讲的,实际上每一句话都是说,一个词在某种程度上可以被另外一个词来替换。你像我们刚才说的乌鸦是鸟,那就是说你根据关于鸟的一些一般性的知识,你可以把乌鸦这个词换进去,你觉得这些知识还能成立,或者说某些东西你把它叫乌鸦,你也可以把它叫做鸟,你的这个结论也仍然成立。实际上讲的是概念之间的替换关系。
所以下面我们下面看几个比较典型的规则。我们从最简单的演绎规则开始看。我在这张片子上可以看到几个定义,一个是这个规则本身的它相关的定义,另外一个是可以看到它的一个例子,然后可以看到它那个图示。我们直接从例子开始说,这个例子实际上说,我这个系统在一定程度上相信鸟会飞,后边当然有一个真值就是我刚才讲的那两个数。这第一个数是“1”,那就是说鸟100%会飞,据我所知,我看见的鸟都会飞,我没看见过不会飞的。“0.9”就是说明一定程度上,就是你看见过多少鸟,我们现在不涉及到具体的数字,就是大概说的就是这个意思。我是用“1”和“0.9”作为我的“缺省值”,就是说如果你就说一句话,我就假定这个真值水平。
第一句话说鸟会飞,第二句话说乌鸦(麻雀)是鸟。那么你从这两句话里面就可以推出麻雀是鸟,也可以推出来麻雀会飞。但是你相信最后一个推论的程度就会比前面两个的两个略微低一点,因为你对结论的出错的可能性会更大一点,或者说它有它的直接证据支持就会少一点。这个也符合我们的直观感受。我这里面的具体数字都是由函数来算出来的,就是说你有从A到B有这么一条线,从B到C有这么一条线,那么你就可以直接从A到C画一条线。,线本身都有强度的问题,就是说这个真值的问题。这条规则我觉得大家都可以接受,基本没有什么异议,是都可以接受的。
比较有趣的是下一条归纳规则。大家想一下,我知道麻雀是鸟,我知道麻雀会飞,我能说鸟都会飞吗?按照传统的逻辑我不能说。这叫以偏概全,你只看到了一种鸟,你怎么知道其他的鸟会不会飞?我们知道好多鸟都不会飞,但是根据我的这个逻辑,麻雀会飞的存在确实为鸟会飞提供了正面的证据,但是confidence就是可信度相对来说要低了很多。因为什么?因为你只看到了一个例子,你证据不足。用我们日常的说法,不能把这个叫做结论应该叫做一个猜想或者假说。但是这个假说或者猜想也还是有一定事实根据的并不是胡说。
那么下面是一个类似的东西,我管它叫做“归因规则”,英文叫做abduction,中文也有些人翻译成“溯因推理”。它说的是什么?我们直接看例子:如果你知道鸟会飞,知道麻雀会飞,你能不能说麻雀是鸟?严格的来讲你不能说。你现在只知道它的一个特征,而一般来说这个特征确实是鸟所具有的特征,就是会飞。所以在我这里面仍然可以得出
“麻雀是鸟”这个结论,但是你得说这只不过是个猜想,虽然说这个猜想是有一定的证据来支持的。那么如果现在类似的猜想越来越多了怎么办?我们有一个规则叫做修正规则。这种规则实际上就是把这些零星的证据积累在一起得到一个更加可靠的结论。具体看这个例子,比如说有些证据告诉我鸟会飞,另外一些证据告诉我鸟不会飞,最后一个结论如果翻译成自然语言是类似说可能大部分会飞吧,而你看这个结论的可信程度比前面那两个都高。因为什么呢?因为它考虑到的证据比较多。所以就是这样一些简单的规则使得这个系统逐渐地把各个方面的证据总结、积累起来得到一些更可靠的结论。
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!