人性论第一部–论知性

less than 1 minute read

《人性论》是苏格兰哲学家大卫休谟的代表作。

这本书是哲学史上的一部重要著作,同时也被后世评价为认知科学的奠基之作。有趣的是,本书在发表后反响平平,这让休谟很失望。

哲学家很多都是杠精,大卫休谟也不例外。他连因果律都怀疑。那个太阳是否明天升起的论点就是他提出的。

大卫休谟与弗朗西斯培根以及约翰洛克一同被认为是经验主义的代表人物。他在这本书中系统性地陈述了他的这一哲学主张。

《人性论》是一本大部头。这里所说的人性并不是我们通常所说的道德方面的本性,而是一个更宽泛的包括认知、情感、以及道德的概念。全书分为三卷:

  1. 《论知性》:讨论了人类的认知能力。
  2. 《论情感》:讨论了人类的感性部分。
  3. 《论道德》:讨论了道德来自于情感而非认知和理性。

由于全书内容很多以及个人对认识论更感兴趣,我打算先只读第一部分,即《论知性》。

drawing

关于想法,以及想法的来源、组合、连接、以及抽象化的讨论

一开篇,大卫休谟就提出了一系列概念来便于对认知的探讨。

他首先提出了人们感知到的信息分为”印象(impressions)“以及”想法(ideas)“。

印象是人类对外部直接获取的原始信息直接感知。想法是对信息进行加工后的人造产物,本质来源是印象。区分印象和想法的一个方法是判断这个信息是否能够纯靠推理想象得到。比如一个从来没吃过苹果的人无法想象出苹果的味道,那么苹果的味道就是印象。

drawing

进一步,印象可以细化为”感觉印象(impressions of sensation)“和”情感印象(impressions of reflection)“。前者就是我们通常所说的五感了。休谟处在18世纪,当时还没有脑科学。因此他认为前者是由灵魂通过不明机制来处理。现在我们知道外部信息是通过电信号通过神经传递到大脑处理的。

想法也可以细分为”关于记忆的想法(ideas of the memory)“和“关于想象的想法(ideas of the imagination)”。比如对昨天参加的宴会的记忆属于前者,而看到一个漂亮女生后连孩子的名字都想好了属于后者。

drawing

关于记忆的想法是基于我们实际经历过的事情,因此相关的信息更具体、更生动、也更有色彩。比如我们可能清楚地记得昨天和哪些人聊了天,或者吃了哪些菜。

关于想象的想法是我们大脑通过信息组合臆想出来的内容。相对于前者,后者缺乏细节,也更加模糊。比如即使你想好了孩子的名字,但可能没有孩子长相或者其他方面的想象。

休谟在这一章中提出了和我心中一个模糊想法暗合的概念,即我们所有可能的想法都是基于外部接收的信息的排列组合。他同时指出,扩充我们想象的三种方式:相似性、空间以及时间上的连续性、以及因果关系。比如我们可以想象出一个更大的iPhone,于是便有了ipad。一个基于空间连续性想法的产物。

现在火热的text-to-image AI也无法摆脱这样的规律。我们对其生成图片的评价是认可(生成的图片真像!)而不是受启发(这是什么东西?超出我的想象!)。毕竟模型也是受训练数据所限,而这些训练数据和我们日常能够接触到的信息差不多。

比如当我们输入核聚变发电机时,AI生成了如下左图。我们很容易看出信息的来源是实验中的托卡马克核聚变装置。

drawing Text-2-image 模型生成的核聚变发电机图片

drawing 实验中的托卡马克核聚变装置

当我们输入一些我们完全未知的东西时,AI生成了我们可以证伪的图片。比如黑洞内部实际是黑洞外部的图片。而当输入负时间这个词时,生成的图片则完全不搭边了。

drawing AI生成图片:Prompt: inside the black hole

drawing AI生成图片:Prompt: the negative time

机器学习的优势是可以极为有效率的帮我们对已有信息进行排列组合,但是对拓展认知边界帮助有限。

drawing AI生成图片:黑客帝国版笛卡尔

drawing AI生成图片:老子对决苏格拉底。​分不清谁是谁。其中一个人还有三只手。​

我们绝大多数的创造发明都是在基于已有外部信息的认知闭包中的组合,而那些能够突破这个闭包的想法则是伟大的。比如微积分的发明建立了无限小到有限大的桥梁;黎曼几何的提出为相对论提供了工具,从而让我们用全新的视角去看待时空;而概率论的建立则帮我们更好地描述事物的不确定性。

经验主义为理性主义提供了参考样本,而理性主义为经验主义提供方向去搜集更有价值的样本。

论空间和时间观念

在这一章中,休谟围绕着时间和空间集中探讨了四个问题:

  1. 有限和无限: 休谟对朴素观察的结果进行逻辑推理,认为无论是我们的抽象思维还是空间时间,都不能无限分割下去。如果空间是可以无限分割的,那么我们便无法定义长度。比如我们无法说一厘米比一米短,因为无论是一厘米还是一米都包含了无限多的部分。也许休谟没有进修数学,因为在他之前牛顿已经从数学的角度解决了无限与有限,以及无限与无限(比如高阶无穷小)的关系。从物理角度来说,普朗克常数确实限定了一个小的程度。普朗克长度以下的空间以及普朗克时间以下的时间对我们没有意义,因为这个尺度以下的变化我们无法认知。但这仍然没有否定普朗克尺度以下的事物的存在性。
  2. 空间、时间和物体的关系:休谟认为这三者是密不可分的。我们想象不出不存在于空间中的物体,同样也想象不出完全的真空。这里说的真空和我们日常生活中所说的没有空气的真空不一样,是指真正完全没有物体的无限空间。此外,我们对于时间的判断依赖于物体的状态变化。如果不存在物体,或者所有物体的状态都不变,我们便无法判断时间的流逝。想想看电影是不是都通过这种方式表现时间静止的。

drawing 直径2.5亿光年的牧夫座空洞,空是由周围的不空来衬托

drawing 黑客帝国剧照,实际上真正的时间静止应该是什么也看不见的,因为光子也停止运动了

  1. 存在与感知:我们记忆中以及想象中的任何存在都来源于我们的印象。有些存在可能是直接的印象,比如我们吃过的东西或者看过的东西;有些存在是我们对一个或者多个印象的加工组合,比如我们可能从来没见过独角兽、龙、或者狮身人面,但是我们可以想象出来它的形象。

论知识和概然性推断

休谟一开始便重新回顾了7个事物关系:resemblance,contrariety,degrees in any quality,proportion in quantity or number, identity,relations of time and space,and causation。

并且指出这些关系让我们通过直觉(intuition)、论证推理(demonstrative reasoning)、感知(perception)、可能性推理(probable reasoning)四种方式产生知识:

直觉(intuitive)

前4种关系我们可以直接通过直觉获取知识。直觉是对某些东西的直接、立即和显然的认识。这是一种基本的、基础的知识形式,不是从其他来源导出的。因此它是内部固有的。比如两个三角形相似,或者一个东西比另一个东西更亮。即使休谟主张经验主义,但他还是认同有些东西是人的认知固有的。

不过遗憾的是,无论是笛卡尔还是休谟还是其他哲学家,他们认为“显而易见”的事情在现在看来并不那么简单。比如一个东西比另一个东西更亮这个现象其实是感知的结果而非事物的本质。即使两个相同亮度的物体,由于其所在环境不同,我们感知出的亮度也可能不一样。

我们可能已经看过很多遍下面这个认知偏差的例子。这个物体上下两部分在我们大多数人看来是“显而易见”的不同亮度,但如果我们试着用手指挡住中间部分,就可以看出它们是相同亮度的。

drawing 视觉偏差图片

论证推理(demonstrative reasoning)

对于proportion in quantity or number,我们也可以通过论证推理来获取知识的。我们所熟知的数学证明就是论证推理。对于论证推理,我们可以从已知条件一步步严密地通过计算或数理逻辑得出结论,每一步都是确定且绝对正确的。

现代计算机的冯洛伊曼结构是在通用图灵机的基础上提出的,而通用图灵机本质上是一个数学模型(partial computable function),因此我们可以说现代计算机的理论基础也是建立在确定性推理的基础上的。当然,在引入随机数之后,计算机的能力显得更加多样性与灵活。

感知(perception)

对于identity和relations of time and space,我们是通过感知来获取知识的。与直觉相对应,感知是因外部而产生的。感知是心灵组织和解释感官印象以形成对世界的连贯理解的过程。休谟认为,我们所有的想法,即对物体或概念的心理表征,最终都是来自感知,而不是直觉。换句话说,我们只能通过感官对事物有所了解,而不能从本质上了解它们。

现代人工智能也是通过外部数据驱动的方式来建立感知模型的。模型本质上是一个基于弱假设的空壳子(包含卷积、采用或者残差等结构的神经网络)。感知模型的质量完全由数据质量决定。尽量少的先验知识的模型有好有坏,好处是模型本身没有人为先验知识干扰,坏处是数据质量非常影响模型质量,其实也会间接受到人为干扰。这些模型可以从视觉信号上识别出猫或者老虎,但它们并不能从更加本质地层面了解他们,比如猫和老虎从基因上面的关联性这种所提供数据排列组合之外的信息。

或然性推理(probable reasoning)

最后是causation,休谟认为因果并不天然存在。我们对于因果的认知是通过不断重复观察到两个事物先后出现的推理结果。因果是可能性推理的产物,而不是必然或者天然存在的。即使是我们觉得天经地义的关系,也并不是亘古不变的。

drawing 太阳每天升起这种显而易见的事情也并不是必然的,有兴趣的可以看看https://www.ixigua.com/7048532455225197059

休谟对于因果的理解是有一定道理的,我们所有对于因果的建立都是基于对过往的观察而总结得出的。如果在一定时间范围内A事件基于过往观察总是导致B事件,那么我们就认为A是B的因。在休谟去世的一百多年后,俄国科学家巴浦洛夫研究了条件反射这一机制,人为对实验狗建立因果关系。也许在这只狗的认知里,摇铃和吃到肉是具有必然的因果关系的。如果我们训练另一只狗时把摇铃和骨头联系在一起,那么在另一只狗的认知里,摇铃则和骨头具有必然的因果关系。人类与巴普洛夫的狗对因果的理解没有本质区别,也是根据有限观察样本对事物的关系进行可能性推理。

现代机器学习或者人工智能其实也是基于统计推理来建立预测模型的。比如我们只要上网就可能可能受其影响的推荐系统,就是通过不断展示给用户内容(术语正是impression);收集用户的反馈(是否观看/购买/点赞等);然后结合我们对展示当时的信息(比如我们所了解的用户的信息,被推荐物品的信息,以及当前时间等上下文信息)进行量化(特征工程)建立训练数据的。从模型的角度来看,这些训练数据便是它们所有能观察到的外部信息,决定了它们对因果的理解。比如过往消费高的用户倾向于购买高端的商品,那么如果下次遇到一个过往消费高的用户,模型便倾向于推荐高端商品。

推荐系统受到数据影响,用户其实也受到推荐系统影响。如果我们在新闻推荐系统里面一直推荐某人某事的负面消息,那么我们的认知里便会对其产生不好的印象。即使我们从来没有真正了解过它们。推荐系统在现今社会深刻地决定着人们能够接触到的信息。信息决定认知,认知决定三观。

论怀疑主义及其他哲学主题

在这一章里,休谟主要探讨了怀疑主义以及过往的其他哲学主题,比如认为外部(非自身)事物持续客观存在的信念,以及我们对外部事物认知的局限性。

对于怀疑主义,他提出“所有的知识都只是概率上的正确“(比如从A推导出B),即使是数学这样的纯抽象知识也并不能保证绝对正确,因为我们无法保证我们的每一步推导绝对正确。因果的不确定性可以让人对所有事物陷入彻底地怀疑。休谟进一步指出,现实中这种情况之所以没有发生,是因为我们的思维具有有限的能动性,使我们把高概然性的因果当成必然的因果。比如我们没有精力为了那微不足道可能性持续去思考氧气对人是否必需这个问题。

外部事物持续客观存在的信念

接着,休谟开始讨论我们为什么相信外部世界的存在,比如在我们不观察一个物体的时候,我们认为这个物体仍然持续客观(continued and distinct)存在。他讨论了三个支持这种信念的来源:感知、推理、以及想象。最后他认为感知和推理都无法得到外部物体持续客观存在这一结论,而是想象支撑着这一信念。需要注意的是,这里并不是说想象决定了事物的存在,而是人对于事物持续存在的理解基于想象。

个人认为,对于物体的持续客观存在这一信念同时来源于感知、推理、以及想象。比如我们就是通过结合三者来设计目标追踪机器学习算法的。就拿很流行的DeepSORT算法来说,这个算法分为四个步骤:识别(detection),估计(estimation),关联(data association),以及身份更新(identity)。其本质是对识别对象(感知)根据假设(想象)以及统计模型(概然性推理)进行”实“与”名“关联的算法。

drawing DeepSORT算法应用于路人追踪。图片来源:https://arxiv.org/pdf/1703.07402.pdf

我们对外部事物的了解

对于外部事物,休谟还指出我们永远无法对其进行完全了解。因为我们对外部事物的了解基于感知传达的信息。而基于感知传达的信息只是事物某一方面的投影。休谟的这一观点同同时期稍晚的康德的”物自体“的观点相似。估计康德从中受到了不少启发。

这个观点可以通过一个机器学习的例子加以说明。机器学习中有一个叫做特征工程的流程,意在从原始信息(比如impression)中提取出有意义的可量化信号来让模型从中学得规律。从某一方面来说,模型的强大程度取决于特征的丰富程度以及质量。

比如我们想让一个模型来预测将来用户的网页浏览行为,通常的做法是进行用户特征提取来使得模型更了解用户。如果我们只抽取简单的信息,比如年龄性别的话。那么从模型的世界观中,它对用户这个事物的全部了解就只可能是这两个信息了。模型可以掌握到的所有规律也无非是这两个特征的排列组合。但如果我们提供模型更多的用户特征,比如每天浏览网页的时间、过去一个月浏览了哪些网页、分享了哪些网页、在每个网页逗留时间等特征。那么模型对该用户的了解程度便大大提升。掌握这些信息的模型对于用户行为的预测精度会高于只知道用户年龄性别的模型。

drawing 一个模型对用户的所有理解来源于我们所提供的信息

现代基于深度学习的模型在对事物的了解上更加深刻。对于一幅图或者一段话这种具体形象的对象(而不是用户浏览行为这种概念性对象),深度学习模型可以自动抽取(比如通过卷积或池化操作)特征并对其加以利用。此外,当特征数量过多时,我们还可以通过embedding的方法来更好地用一个相对低维的向量来表征一个我们所理解的对象。但无论模型怎么玩花样,它所做的事情只是更好的对原始数据做变换以使其更好地对其进行消化。对原始信息本身的信息丰富程度,模型则依赖于传感器的多样性及质量。

总结

《论知性》是休谟《人性论》三部曲的第一部。这本书探讨了人类理解事物的本质。休谟认为,思维是被动的,所有的知识和理解都来自我们对世界的经验。他还认为,思维由两种类型的心理状态组成:印象和想法。印象是我们对周围世界的直接而生动的体验,想法则是从印象派生出来的,不那么生动,不那么直接。休谟还讨论了因果论的概念,认为我们对因果关系的信念是基于习惯和惯例,而不是事件之间的内在联系。最后,休谟探讨了怀疑论,包括我们如何理解独立于我们自身存在的外部事物,以及我们对外部事物本质的了解。

题外话:这篇文章有一部分是我直接从与ChatGPT语言模型的对话中抄下来的,不知道各位看出来没有。

Leave a comment