Skip to content
Go back

你最有价值的知识,恰恰是你说不出口的

有一个矛盾埋在专业技能的核心:专家判断力是可以习得的,因为人们确实会随时间积累;但它又无法传授,因为没有哪个专家能通过解释把自己的判断力转移给另一个人。如果它曾经是可学的,为什么偏偏教不了?

这篇文章给出了一个清晰的解释,值得认真读完。

维度的问题

先从一个日常场景开始:过马路。

一条简单的规则可以这样写:有没有车?车速多快?距离多远?这三个变量足以应付绝大多数情况,也可以用语言完整地表述出来,让一个从没过过马路的人照着执行。

但有经验的行人实际在处理什么?他们同时整合着:车速、加速状态(踩刹车还是加速)、路面状况(干燥或湿滑对刹车距离的影响)、驾驶员的注意力(在看手机吗)、车辆在车道内的轨迹(有没有漂移)、其他车辆是否遮挡了驾驶员视线、路宽、自己今天的行走速度(手里拿着东西吗,有没有受伤)、旁边其他行人的动作(他们是在自信地穿行还是在犹豫)、发动机声音(声音变大还是变小,这比速度变化先出现)、车型(卡车和自行车的制动特性完全不同)、时间点(影响驾驶员的疲劳程度和能见度)……

大约三十到五十个输入维度,同时处理,不到一秒得出结论。这个模型不是一张规则表,是通过几千次过马路的经历(安全穿行、险些被撞、被喇叭催促)校准出来的模式匹配系统。它运转良好,比三变量规则产生更好的决策,也无法用语言完整地表达出来。

语言为什么传递不了

语言是一种串行、低带宽的信道。它一次传递一个命题,每个命题最多关联几个变量。把条件语句叠加到五六个变量,句子就变得难以解析;超过这个数量,读者在读到结尾时已经忘了开头。

专家模型不是按这种形式运转的。它是从高维输入空间到输出的连续、非线性映射。真正的信息藏在变量之间的交互效应里:路面湿不湿,得结合车速来看;车速怎么影响判断,又得结合驾驶员的注意力;而驾驶员的注意力,又得结合当天的时间段。这不是可以逐项列举的加法效应,是跨越多个维度的乘法交互。

交互效应的数量随输入变量呈组合式增长:五十个变量,仅两两交互就有 1,225 种组合;三变量交互超过 19,000 种。专家模型经过经历的校准,已经学会了哪些交互效应真的重要、哪些可以忽略,而这个权重分配正是专业技能本身。语言传递不了它,因为要传递它就需要逐一列举所有相关交互并说明各自的权重,而相关交互的数量远超语言描述的实际上限。

这不是人类认知能力有什么缺陷。这是一个关于信道容量的信息论命题:自然语言的带宽,相对于所要传递的模型复杂度而言,根本不够用。

书本知识与街头智慧

这个框架重新解释了”书本知识”和”街头智慧”的区别,而且剥掉了这个说法里通常隐含的反智色彩。

书本知识指的是维度低到可以用语言压缩的知识。正规教育非常擅长传递这类东西:数学关系、历史事实、科学理论、逻辑框架、语法规则。这些模型很强大,定义上也是那些复杂度低到可以压缩进语言形式的模型。整个正规教育体系建立在这样的假设上:一个领域里最重要的知识可以通过教学传授,这个假设在某些领域成立,在另一些领域则不成立。

街头智慧指的是维度太高、无法通过语言传递、因此只能通过有反馈的经历校准而来的模型。拥有街头智慧的人无法解释自己为什么知道,这让他们在书本知识派的人眼里显得表达能力差,于是书本知识派得出结论:这人的知识是低级的。这个结论在需要判断力的领域里恰好完全搞反了。无法说清楚模型,不是模型粗糙的证据,而是模型复杂到超出了传输信道上限的证据。

对书本知识的文化偏见,是一个更广泛的”可读性陷阱”的具体表现。书本知识是可读的:可以测试、可以颁发证书、可以通过考试验证。经验判断力是不可读的:无法考察,只能在它的输出结果里观察到,而且需要相当长的时间。依据可读证书分配权力的机构,系统性地把书本派提拔到需要判断力的岗位上,这在知识类工作里行得通,在判断力类工作里则会灾难性地失效。

悲剧在于,做这个人员配置决定的人,本身就是书本派选拔机制的产物。他们通过表达能力和形式推理来评价智力,因为这恰好是他们被选拔出来所依赖的那些维度。一个做对决策却无法在董事会上解释清楚推理过程的老手,看起来不够成熟,而实际上他跑的模型比那个能产出漂亮 PPT、但真实预测准确率和随机差不多的策略师更复杂。

经验为什么压缩不了

更深层的问题是:经历为什么需要那么多次重复?如果专家模型在某种意义上是从输入到输出的函数,为什么不能直接描述这个函数?

原因有两个。

第一个原因:专家本人也不知道这个函数的显式形式。他们的模型储存在产生正确输出的神经网络权重配置中,没有一种可以被有意识地检视的符号形式。这不是什么神秘说法,是神经网络(无论生物的还是人工的)的一个已知属性:它们可以在不显式记录映射关系的情况下逼近任意复杂的函数。网络”知道”这个映射,体现在它能产生正确输出,但这种知道分散在数百万个连接权重里,没有一个权重单独编码了一个有意义的命题。

第二个原因,也是更根本的原因:相关特征不是事先给定的。专家通过经历学到的一大部分,正是环境里哪些特征重要。新手不仅仅是对特征的权重打错了,他们根本没有感知到相关特征。有经验的驾驶员不只是比新手更准确地判断速度和距离,他们还能注意到车辆在车道内的微妙漂移——这个特征在新手的感知里压根就不存在。

这是经验无法压缩的最深层原因。你没办法传递一个建立在接收方根本感知不到的特征上的模型。教人安全过马路,主要不是传递一套关于速度和距离的规则,而是培养能够检测车道漂移、发动机音调、驾驶员视线方向和旁边行人细微肢体语言的感知能力。这种感知能力的发展需要直接暴露在经历中——这些特征没法用语言指出来,因为”指出”这个动作本身就需要接收方已经能感知到被指的东西。

这造成了一个自举难题。专家无法传递模型,因为接收方缺少模型运转所依赖的感知类别;接收方无法发展那些感知类别,除非通过建立这些类别所需要的经历。教学可以通过引导注意力来加速这个过程(“看驾驶员的眼睛,不要只看车”),但替代不了它,因为这个指示只对已经开始发展相关感知敏感性的人有意义。

可传递性的层级

基于上述分析,知识大致可以按可传递性排列:

最易传递:事实与明确规则。“水在海平面 100°C 沸腾。“可以完整压缩进语言,可以通过教学完整传递。

次之:形式模型与框架。“净现值是折现后未来现金流的加总。“需要一定前置知识,但准备好之后可以完整传递。

再次:从经验中提炼的启发式规则。“警惕那些谈竞品多过谈客户的创始人。“可以部分传递,作为引导接收方进行校准的注意力指针是有用的,作为独立规则则容易误导,因为例外和规则一样重要,而例外无法枚举。

最难传递:感知校准本身。感知哪些特征重要、在特定情境中如何权衡它们、识别这个情境与表面相似的其他情境之间的细微差异——无法通过任何语言信道传递,只能通过在某个领域长期、有充分反馈的实践中习得。

正规教育体系几乎完全在前两个层面运作。学徒制主要在第三个层面。第四个层面只有在完成学徒制之后通过独立实践才能获得,这就是为什么即使是受过最好训练的专业人员,在毕业后也需要多年实践才能形成真正的专家判断力。医学界用住院医制度承认了这一点。其他大多数领域假装从可传递层面毕业就已经足够,这就是为什么那些领域的实际表现系统性地低于其正规培训的质量。

组织层面的后果

这对组织如何处理专业技能的影响是严峻的。

当组织试图通过编码把判断力领域去技能化——通过框架、检查表、决策树和流程文档——他们实际上是在尝试把第四层知识(感知校准)压缩成第二层知识(形式模型和框架)。这种压缩是有损的,而且有损的恰恰是真正重要的那部分:它保留了可传递、可读的组成部分,丢掉了不可传递、才是专业价值真正来源的组成部分。

然后组织用在第一、二层训练过的人来操作这套编码系统,这些人勤勉地应用框架,在常规案例里产出合格结果。被替代的专家看着这套框架,看到了它缺失的一切——每一个被忽略的交互效应,每一个它无法编码的感知特征。组织看着这套框架,看到了一个成功去技能化的功能,以更低成本运行,产出更一致的结果。两种观察都是准确的,但在量不同的东西:组织在量框架为之设计的那些常规案例上的表现,专家在量那些框架无法处理的非常规案例里积累的脆弱性。

解决方案只在一次非常规案例产生灾难性失败时短暂出现。然后,所有人短暂地同意专家判断力被低估了。开展审查,提出建议。建议不可避免地采用额外规则和框架的形式,因为那是组织能处理的唯一知识形式。规则被加进编码系统。系统变得更复杂、更脆弱、更不能处理下一次非常规案例——而下一次和上一次会以新规则无法预料的方式不同。循环重复。

正确的结论,对任何投身于知识形式化项目的人来说都是令人不舒服的:人类专业技能最有价值的形式,恰恰正是最抵制形式化的那些。它们可以习得但无法教授,可以获得但无法传递,可以展示但无法表达。每一次把它们压缩成可传递格式的尝试,都会销毁使其有价值的那些信息。唯一可靠的发展这些技能的方法——长期的、有足够反馈的直接经历——正好是那个无法被规模化、无法被标准化、无法被显著加速的方法。

聪明人可以指给你看方向,但带不了你走。走过去这件事,需要你的神经系统亲自完成,一次有反馈的重复接着一次。

参考


Tags


Next

Microsoft Agent Framework vs Semantic Kernel:C# 中如何选择