知识表示:从人脑到电脑的“知识翻译术”-《大白话聊透人工智能》

  咱们先从一个日常场景说起:你跟朋友推荐电影,会说“《流浪地球2》特别好看,是科幻片,讲的是人类建行星发动机逃离太阳系的故事,里面的太空电梯特效绝了”。短短几句话里,藏着“电影名称、类型、核心剧情、亮点”这些知识,而且你说得条理清晰,朋友一听就懂。

  这其实就是人类的“知识表示”——把脑子里的想法、信息,用别人能理解的方式(比如语言、文字、手势)表达出来。但如果换成电脑,情况就不一样了:它没有“脑子”,只有一堆代码和数据,怎么让它“看懂”《流浪地球2》的相关知识?怎么让它像人一样用这些知识回答问题、推荐电影?这就需要专门的“知识表示”技术,说白了就是一套“把人类知识翻译成电脑能懂的语言”的方法。

  接下来咱们就彻底掰扯明白:知识表示到底是啥、人类和电脑的知识表示有啥不一样、电脑有哪些“翻译知识”的套路、这些套路有啥用,保证不用专业术语,全是家常话。

  一、先搞懂:知识表示到底是“啥玩意儿”?

  其实不管是人还是机器,知识表示的核心就一个:“怎么把知识存起来、说清楚、用得上”。咱们先拆解开,从最基础的概念说起,把地基打牢。

  1. 知识是啥?—— 不是“死记硬背”,是“有用的信息 关系”

  首先得明确:“知识”不是孤立的“知识点”,比如你知道“苹果是红的”,这只是个信息;但你知道“苹果是水果,能吃,富含维生素,成熟的苹果通常是红的或绿的,能用来做苹果派”,这些**“信息 信息之间的联系”** 才叫知识。

  就像一本菜谱,单看“盐5克”是信息,单看“鸡蛋2个”也是信息,但把“先打鸡蛋、再放盐、然后炒”这些步骤和食材联系起来,才是“炒鸡蛋”的知识。知识的价值,恰恰藏在这些“联系”里。

  2. 知识表示是啥?—— 给知识“找个合适的表达方式”

  知道了知识是“信息 关系”,那知识表示就是“给这些知识找个能被理解、存储、使用的表达方式”。这事儿对人来说很自然,对电脑来说却得“刻意设计”。

  咱们举个对比例子:

  - 人类的知识表示:你想记住“李白是唐朝诗人,写过《静夜思》”,可能会在脑子里形成一个模糊的“人物卡片”,卡片上写着“李白”,旁边画个箭头指向“唐朝”,再画个箭头指向“《静夜思》”;跟别人说的时候,直接用语言讲出来,或者写在纸上,别人一看就懂。

  - 电脑的知识表示:电脑没法理解“人物卡片”,也看不懂手写文字,得把这句话转换成它能处理的“数据结构”。比如用“(李白,朝代,唐朝)”“(李白,作品,《静夜思》)”这样的三元组,或者用节点和线组成的图(李白是节点,唐朝是节点,“朝代”是连接两者的线),这样电脑才能“读”懂谁和谁有关系。

  所以简单说,知识表示就是“知识的表达方式”——对人而言,是语言、文字、图画;对电脑而言,是代码、符号、数据结构。而咱们常说的“知识表示技术”,主要就是研究怎么给电脑设计好用的“知识表达方式”。

  3. 为啥要搞知识表示?—— 没有“好表达”,知识就是“废品”

  你可能会问:“直接把文字输给电脑不行吗?为啥非要搞复杂的表示方法?”

  还真不行。就像你给一个不懂中文的老外写“李白,唐,《静夜思》”,他虽然能看到字,但不知道“唐”是朝代、“《静夜思》”是作品,这些文字对他来说就是没用的符号。电脑也是一样,不经过“表示”的知识,对它来说就是一堆乱码。

  知识表示的核心价值有三个,咱们用“查字典”的例子就能看懂:

  1. 让知识“能被找到”:如果字典里的字是乱序的,你想查“李”字得翻遍整本书;但按拼音排序(这就是一种“表示方法”),几秒钟就能找到。电脑的知识表示也是如此,好的表示方法能让它快速搜到需要的知识。

  2. 让知识“能被使用”:你查“李白”时,不仅想知道这个名字,还想知道他的朝代、作品。字典里把这些信息写在“李白”词条下(这也是“表示方法”),你才能把这些知识串起来用。电脑也是,只有把“李白、唐朝、《静夜思》”的关系表示清楚,它才能回答“《静夜思》的作者是哪个朝代的”。

  3. 让知识“能被分享”:如果我按拼音查字典,你按部首查,咱们没法交流查书的经验;但大家都用统一的拼音排序,就能轻松分享“查‘李’字在第XX页”。电脑的知识表示也需要统一标准,比如不同AI系统都用“三元组”表示关系,它们之间就能互相“交流”知识。

  二、对比看:人类和电脑的知识表示,差别到底在哪?

  同样是“表示知识”,人和电脑的思路差得老远。咱们就从“记知识、用知识、更懂知识”三个维度对比,一下子就能看明白两者的核心区别。

  1. 记知识:人类“模糊灵活”,电脑“精确死板”

  人类记知识就像“搭积木”,不用追求绝对精确,能拼起来用就行;电脑记知识就像“摆拼图”,每一块必须严丝合缝,错一点都不行。

  比如记“狗是哺乳动物”这个知识:

  - 人类的记法:你可能不会刻意想“哺乳动物的定义是胎生、哺乳”,但看到狗生小狗、用奶喂小狗,就自然把“狗”和“哺乳动物”联系起来;就算遇到“鸭嘴兽(卵生但哺乳)”这种特例,也能灵活调整认知,不会完全推翻之前的知识。

  - 电脑的记法:必须先把“哺乳动物”的定义写成精确的规则,比如“如果一种动物是胎生且哺乳,那么它是哺乳动物”,再把“狗是胎生、狗会哺乳”这些信息输进去,最后形成“(狗,属于,哺乳动物)”的精确表示。如果遇到鸭嘴兽,不修改规则的话,电脑就会“纠结”:它哺乳但不胎生,到底是不是哺乳动物?

  这背后的原因是:人类的大脑是“模糊处理系统”,能接受不确定性;电脑是“精确计算系统”,只能处理明确的指令和数据。

  2. 用知识:人类“靠直觉联想”,电脑“靠规则推理”

  遇到问题时,人类用知识靠的是“直觉和联想”,有时候自己都没意识到“为啥这么想”;电脑用知识靠的是“预设的规则”,每一步都能说清楚“怎么来的”。

  比如回答“为什么夏天白天比冬天长”:

  - 人类的思路:可能先想到“地球绕太阳转”,然后联想到“地球是斜着转的”,再想到“夏天太阳照北半球的时间长”,最后得出结论。整个过程是跳跃的,可能还夹杂着小时候看科普片的记忆,甚至没明确想“黄赤交角”这个专业词,也能说出大概原因。

  - 电脑的思路:得先有一套明确的知识表示和推理规则:

  1. 存储知识:(地球,绕转对象,太阳)、(地球,自转状态,倾斜)、(倾斜自转 绕太阳公转,导致,不同季节日照时间不同)、(北半球夏天,日照时间,长于冬天)。

  2. 执行推理:用户问“夏天白天比冬天长的原因”,电脑先搜“白天长短”相关的知识,找到“日照时间”这个关键,再顺着“日照时间→公转 倾斜自转”的关系链条,最后把这些知识组织成回答。

  简单说,人类用知识是“凭感觉走捷径”,电脑是“按规矩走流程”。

  3. 懂知识:人类“知其然也知其所以然”,电脑“知其然不知其所以然”

  人类记知识的时候,会顺带理解“背后的道理”;但电脑记知识,只是把“符号和关系”存起来,根本不懂这些符号到底是什么意思。

  比如“水烧开后会沸腾”这个知识:

  - 人类的理解:你不仅知道“水烧开=沸腾”,还知道“这是因为温度到了100℃,水分子运动变快”,甚至能联想到“高原上水温不到100℃就沸腾,因为气压低”。你懂“水”“温度”“气压”这些概念的实际意义,还能举一反三。

  - 电脑的理解:电脑里存储的是“(水,达到温度,100℃)→(水,状态变化,沸腾)”“(环境,气压,低)→(水,沸腾温度,低于100℃)”这样的规则。它知道“100℃”和“沸腾”有关,但根本不知道“水”是啥味道、“沸腾”是啥样子,更不会有“用沸腾的水做饭”的生活联想。

  这就是最核心的区别:人类的知识表示是“有意义的理解”,电脑的知识表示是“无意义的符号处理”。就像你能看懂“苹果”是能吃的水果,电脑只知道“苹果”是一个节点,和“水果”“能吃”这些节点有连接。

  三、拆套路:电脑常用的“知识表示方法”,用例子讲明白

  为了让电脑能处理知识,科学家们设计了十几种表示方法,就像不同的“翻译话术”,各有各的用处。咱们挑最常用的6种,用生活场景当例子,保证一看就懂。

  1. 逻辑表示法:像做数学证明,精确但死板

  这种方法是把知识写成“逻辑公式”,就像初中数学里的“若A则B”,精确到没朋友,但灵活性差。它的核心是“用符号表达条件和结论”,适合处理严格的推理问题。

  举个例子:用逻辑表示法写“如果这本书是张三的,那么它是蓝色封面”。

  会写成这样的公式:Book(张三) → Color(蓝色)

  - “Book(张三)”是条件:这本书属于张三;

  - “→”是“如果…那么…”;

  - “Color(蓝色)”是结论:封面是蓝色。

  实际用处:比如智能题库里的逻辑题,电脑可以用这种方法推理。比如存储“所有直角三角形的两条直角边平方和等于斜边平方”“这个三角形是直角三角形,两条直角边分别是3和4”,电脑就能通过逻辑公式算出“斜边是5”。

  优点:绝对精确,不会有歧义;缺点:太死板,没法处理模糊知识。比如“大部分年轻人