创新的根基之“信息概念的突破”

http://dushuren123.com/lecture1709740332.mp4

钟义信
查看全部 内容介绍:
收起 内容介绍:

 

 

 

我们要研究信息科学的第一件事,是分清楚你讲的信息是什么信息,是外部世界里面的客体信息,还是你脑子里自己产生出来的信息。把只有形式的信息概念扩展、改造成为既研究形式,也研究内容,还研究效用。真的信息就是形式、内容、效用(或者价值)三位一体。这个信息叫做“感知信息”。

 

 

 

 

刚才我们已经把一些轮廓性的概念讲完了,现在我们就进到第二部分,就是在那个模型下面,怎样来首先对基本概念进行研究。刚才讲老的方法论已经得到了很多概念,但是这个概念都有局限性,所以,你要对它进行创新研究,这个概念本身需要改造,需要突破,这叫创新的根基。

那么信息科学,人工智能里头这个基本概念,当然有很多,最重要有三个,一个是信息,一个是知识,一个是智能。首先来看信息。信息的概念,当然大家都知道,是由1948年有个美国人叫Claude Shannon(香农)(克劳德·香农),他在一篇很长的文章叫《通信的数学理论》当中提出来的,这个文章后人就把它叫做《信息论》。

他对信息(的)概念怎么认识呢?他就认为,什么叫信息?信息就是用来消除随机波形的不确定性的东西。要注意一点,Shannon(香农)本身没有讲什么是信息,但是从他计算信息的信息量的公式,可以非常明确地体会到,他心中理解的信息就是这个东西。因为他研究通信系统,发送端发一个波形,经过了一个有噪声的信道,接收端也接收这个波形,要恢复这个波形。

但是,信道里有噪声,所以收到的波形跟接收的波形是不一样的,那么怎么样能够在接收端,能够恢复到人家发送过来的波形一样的,或者基本一样的这个波形,这就是信息要起作用。所以他就认为,我为什么能够准确地恢复这个波形呢?就因为我得到了信息,这个信息就帮助我排除了那个波形当中随机的不确定性的那些因素。所以他的这个信息,虽然没有文字的表述,但是他理解的就是消除随机波形的不确定性的东西,就是完全针对通信系统来理解的。

那么我们这里头有一个模型,就是通信系统的输入输出,还有噪声,这个我们回头看PPT就看得清楚这个关系。那么这个概念有成功的一面,但是也有局限,而且很强的局限。原因就因为通信这个工程有个特点,只要把波形这个形式,波形传过去了,或者只要接收端收到这个波形是对的就完了,至于这个波形是什么内容,这个波形有用没有用,有正面作用还是有负面作用,他都不管,通信工程师不管。

因为有用没有用是要用信息的人才关注,通信工程师只管传,我这个信道有这个容量,我就把你传过去,没有这个容量那就拒绝你,他是这样的。所以他只关心形式,不关心内容,也不关心价值。这个价值在技术上也叫效用,其实效用就是价值的一种表现,或者一种表述。

所以我们要突破这个局限的话,就是信息科学研究,当然也是人工智能研究的一个基本点,这点不突破,一切人工智能研究,一切信息科学研究应该认为都不彻底的。因为这是个起点,信息是最基础的概念。而这个信息只有形式没有内容,没有效用,对我们人类来讲,意思就大大地减色了是吧。

因为比如说我们任何一个人得到一个信息,只得到那个信息的形态,不知道它什么意思,也不知道什么内容,不知道它有什么用处,你说这个信息你得到没得到?不能说没得到,因为你看见它的形状了,你得到它的形式了,但是你本质的东西你没得到,因为你不知道它的内容,你也不知道有没有用。

我看八达岭长城的野生动物园,如果你看见只老虎,可是你不知道这只老虎会不会吃人,不知道这个老虎意味着什么,内容是什么,也不知道它对你的效用是什么,那你就危险了,因为你不知道它会吃人,所以你不怕它,结果老虎把你吃了。所以没有内容,没有效用的这种形式,是一种空的形式,对我们的故事一点用都没有,用处很有限很有限。只有像通信这种工程,我只传,我只管传,传过去有用没用我不管,这个地方可以用。

如果你要真的,我要得到信息,用这个信息解决问题。好了,你用这个信息生成策略解决问题,连这个信息是什么,有没有价值你都不知道,你就看见一个波形了,你说你能行吗?不行的,所以很难做决策。因此,我们的这个研究要从最基本的概念,从这个地方。

而且,把只有形式这个信息概念扩展、改造成为既研究形式,也研究内容,还研究效用,这样三位一体,这是这个概念的一个很大的突破。可以说,就把Shannon(香农)信息论从根上给它大的一个扩展,把它解放了。因为原来那个信息不是真的信息,它只是个表面现象,我们把真的信息拿出来,真的信息就是内容、形式、效用或者价值,三位一体。

那么,这样一来,我们首先从这个模型我们看到,对了,我应该声明一点,现在社会上,中国也这样,外国也这样,对信息的概念讨论得很乱。一个基本的原因乱在哪里?就是你讨论信息,我也讨论信息,你也讲信息,我也讲信息,可是你讲的信息跟我讲的信息是两码事,不是一个事。因为你从那个模型看,一个信息是客体产生的客体信息,另外一个信息是这个主体接收了你这个客体信息之后,结合它自己的知识和目的,自己产生出了一个叫感知信息,这两个信息有关系,但是很不一样。

所以你考虑的信息到底是感知信息还是客体信息?大家平常都不讲,就是信息信息,那么这样就乱套了。等于是我想的是感知信息,你给我讲的是客体信息,这个牛头不对马嘴,所以永远得不到结论,永远得不到统一。所以这个事情,我觉得研究信息科学的人,至今都没有冷静下来考虑到信息有两种类型,而两种类型对我们研究信息科学都很重要,不能够模模糊糊的、笼而统之把这两个信息混为一谈。

这个事我觉得我们要研究信息科学,创新研究的第一件事,分清楚你讲的信息是什么信息,是外部世界里面的客体信息,还是你脑子里看了以后你自己产生出来的信息。现在这两个信息在模型上表现得很清楚,首先是外部世界,客体在运动,运动的状态和状态的方式就是信息,这个信息作用于主体。主体收到的这个信息以后,根据它的目的和知识,为自己理解出来一个信息,理解出了这个信息叫做“感知信息”。来源于客体信息又高于客体信息,因为感知信息才有形式、内容、效用三位一体。

外部的客体信息它呈现出来的就是一种运动状态和状态改变的方式。它没告诉你什么内容,没告诉你什么价值,是我们人观察这个东西以后,变成了我自己的感知信息,我才知道那个东西对我有用没用,感知信息的效用出来了。我知道那样一个形式,它的内容意味着什么,有内容了。所以这个三位一体是,我们感知信息才有这个三位一体。

那么Shannon(香农)这个信息应该是感知信息,因为他传的信息都是传感器产生的,传感器产生的就表示不是客体直接的。客体对客体的信息经过了这个传感器。比方说话筒,然后进入到通信系统,它应该是这个感知信息。可是,感知信息,它的感知信息没有内容,没有价值,只有形式,所以Shannon(香农)信息是远远不够的。那么我们有了这样一个模型,你看,我们就明白了,站在什么基点上,这个信息有什么样的性质,所以这样你才能够很清晰,不会混淆。

好了,这个概念我们如果比较规范地给它下一个定义,客体信息是什么?客体信息就是事物客体所呈现出来的运动状态及其变化方式。也就是状态是什么?状态会怎么变?这就是信息。所以不管是物理,不管是生物哪里,处处都有信息,因为它都表现出这种运动状态,以及这个状态变换的方式。

那么什么叫感知信息?感知信息是主体感知到了你那个外部信息作用于我之后,结合我的目的,结合我的知识产生出来的信息。所以,文字上表达是这样讲,主体从客体信息当中所感知的事物的形式、内容和效用。你看就清楚了,那个是客体表现出来的,这个是主体感知出来的,感知到那个客体信息,从那儿感知出来的。但是感知出来就有形式、内容和效用,其中这个形式就叫做语法信息。

因为语法信息它就只管主语、谓语、宾语这个形式有没有问题,如果主谓宾形式合理,它就接受,如果形式不对头,它就认为有毛病,所以它只管形式。比方说我吃饭,主谓宾,合理。饭吃我,这个逻辑上就不合理,但是饭可以做主语,因为是名词,吃,动词,可以作谓语,我,代词,可以作宾语,这个语法信息认为这个也合理。

所以语法信息不管内容,也不管价值,只管形式。跟我们刚才讲的那个是蛮吻合的,所以借用了这个词汇。那么内容叫做语义信息,它就是义,所谓语义,义就是含义,就是内容。效用信息对主体而言,有用还是有害,这就是它的效用,这个叫语用信息。好了,这个概念就讲清楚了,如果大家要了解更细致,可以看这个PPT最下面介绍一本书叫《信息科学原理》,北京邮电出版社出版的,大家如果有兴趣可以去研究。

那么如果感知信息当中的语法、语义、语用这三个融为一体,那么这个时候这个整体,我们也给它一个名称,这样比较方便,整个语法、语义、语用,比较啰嗦。将来如果它融为一体,把它的整体给一个名称叫“全信息”。这个“全信息”不是说眉毛胡子一把抓什么都算,不是这个意思,不是这个全,而是既有形式又有内容,又有价值,既有语法,又有语义,又有语用,这样的全。

Shannon(香农)相比,Shannon(香农)就是一个统计性的语法信息,所以它是不全的,损失了最本质的东西,这就是我们为什么要改造它。改造它就是因为它是用的这个分而治之的方法,分成语法、语义、语用,他只研究语法这一块,跟我们刚才讲的方法论就联系起来了。这个语法信息、语义信息、语用信息这个三位一体,其实这三个东西内在是有联系的,我们人最关心的是它的语义,就是这个信息到底是什么内容。

那么,实际上这个语义信息,它就能够表现语法和语用。因为这个语法信息的来源,回头我会讲,就是什么模样,有什么用处,然后我给它取个名,这个名字叫做语义信息。它的语法跟语用就支撑它的来源。这张图是表示语义信息可以代表全信息,因为语义信息本身是一个名称。

它的这个形式就是语法信息,它的效用就是语用信息。所以这样将来我们就可能把这个语意信息作为一个整个的代表来处理,这就很方便,而且跟我们人的习惯是一样的,这就是第一个概念。你看,跟Shannon(香农)的信息完全,可以说有很大的不同,不能说完全不一样,因为他也有语法信息,可是他丧失了最重要的内容跟价值。

 

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!

读书人简介:

作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!