你最有价值的知识，恰恰是你说不出口的

有一个矛盾埋在专业技能的核心：专家判断力是可以习得的，因为人们确实会随时间积累；但它又无法传授，因为没有哪个专家能通过解释把自己的判断力转移给另一个人。如果它曾经是可学的，为什么偏偏教不了？

这篇文章给出了一个清晰的解释，值得认真读完。

维度的问题

先从一个日常场景开始：过马路。

一条简单的规则可以这样写：有没有车？车速多快？距离多远？这三个变量足以应付绝大多数情况，也可以用语言完整地表述出来，让一个从没过过马路的人照着执行。

但有经验的行人实际在处理什么？他们同时整合着：车速、加速状态（踩刹车还是加速）、路面状况（干燥或湿滑对刹车距离的影响）、驾驶员的注意力（在看手机吗）、车辆在车道内的轨迹（有没有漂移）、其他车辆是否遮挡了驾驶员视线、路宽、自己今天的行走速度（手里拿着东西吗，有没有受伤）、旁边其他行人的动作（他们是在自信地穿行还是在犹豫）、发动机声音（声音变大还是变小，这比速度变化先出现）、车型（卡车和自行车的制动特性完全不同）、时间点（影响驾驶员的疲劳程度和能见度）……

大约三十到五十个输入维度，同时处理，不到一秒得出结论。这个模型不是一张规则表，是通过几千次过马路的经历（安全穿行、险些被撞、被喇叭催促）校准出来的模式匹配系统。它运转良好，比三变量规则产生更好的决策，也无法用语言完整地表达出来。

语言为什么传递不了

语言是一种串行、低带宽的信道。它一次传递一个命题，每个命题最多关联几个变量。把条件语句叠加到五六个变量，句子就变得难以解析；超过这个数量，读者在读到结尾时已经忘了开头。

专家模型不是按这种形式运转的。它是从高维输入空间到输出的连续、非线性映射。真正的信息藏在变量之间的交互效应里：路面湿不湿，得结合车速来看；车速怎么影响判断，又得结合驾驶员的注意力；而驾驶员的注意力，又得结合当天的时间段。这不是可以逐项列举的加法效应，是跨越多个维度的乘法交互。

交互效应的数量随输入变量呈组合式增长：五十个变量，仅两两交互就有 1,225 种组合；三变量交互超过 19,000 种。专家模型经过经历的校准，已经学会了哪些交互效应真的重要、哪些可以忽略，而这个权重分配正是专业技能本身。语言传递不了它，因为要传递它就需要逐一列举所有相关交互并说明各自的权重，而相关交互的数量远超语言描述的实际上限。

这不是人类认知能力有什么缺陷。这是一个关于信道容量的信息论命题：自然语言的带宽，相对于所要传递的模型复杂度而言，根本不够用。

书本知识与街头智慧

这个框架重新解释了”书本知识”和”街头智慧”的区别，而且剥掉了这个说法里通常隐含的反智色彩。

书本知识指的是维度低到可以用语言压缩的知识。正规教育非常擅长传递这类东西：数学关系、历史事实、科学理论、逻辑框架、语法规则。这些模型很强大，定义上也是那些复杂度低到可以压缩进语言形式的模型。整个正规教育体系建立在这样的假设上：一个领域里最重要的知识可以通过教学传授，这个假设在某些领域成立，在另一些领域则不成立。

街头智慧指的是维度太高、无法通过语言传递、因此只能通过有反馈的经历校准而来的模型。拥有街头智慧的人无法解释自己为什么知道，这让他们在书本知识派的人眼里显得表达能力差，于是书本知识派得出结论：这人的知识是低级的。这个结论在需要判断力的领域里恰好完全搞反了。无法说清楚模型，不是模型粗糙的证据，而是模型复杂到超出了传输信道上限的证据。

对书本知识的文化偏见，是一个更广泛的”可读性陷阱”的具体表现。书本知识是可读的：可以测试、可以颁发证书、可以通过考试验证。经验判断力是不可读的：无法考察，只能在它的输出结果里观察到，而且需要相当长的时间。依据可读证书分配权力的机构，系统性地把书本派提拔到需要判断力的岗位上，这在知识类工作里行得通，在判断力类工作里则会灾难性地失效。

悲剧在于，做这个人员配置决定的人，本身就是书本派选拔机制的产物。他们通过表达能力和形式推理来评价智力，因为这恰好是他们被选拔出来所依赖的那些维度。一个做对决策却无法在董事会上解释清楚推理过程的老手，看起来不够成熟，而实际上他跑的模型比那个能产出漂亮 PPT、但真实预测准确率和随机差不多的策略师更复杂。

经验为什么压缩不了

更深层的问题是：经历为什么需要那么多次重复？如果专家模型在某种意义上是从输入到输出的函数，为什么不能直接描述这个函数？

原因有两个。

第一个原因：专家本人也不知道这个函数的显式形式。他们的模型储存在产生正确输出的神经网络权重配置中，没有一种可以被有意识地检视的符号形式。这不是什么神秘说法，是神经网络（无论生物的还是人工的）的一个已知属性：它们可以在不显式记录映射关系的情况下逼近任意复杂的函数。网络”知道”这个映射，体现在它能产生正确输出，但这种知道分散在数百万个连接权重里，没有一个权重单独编码了一个有意义的命题。

第二个原因，也是更根本的原因：相关特征不是事先给定的。专家通过经历学到的一大部分，正是环境里哪些特征重要。新手不仅仅是对特征的权重打错了，他们根本没有感知到相关特征。有经验的驾驶员不只是比新手更准确地判断速度和距离，他们还能注意到车辆在车道内的微妙漂移——这个特征在新手的感知里压根就不存在。

这是经验无法压缩的最深层原因。你没办法传递一个建立在接收方根本感知不到的特征上的模型。教人安全过马路，主要不是传递一套关于速度和距离的规则，而是培养能够检测车道漂移、发动机音调、驾驶员视线方向和旁边行人细微肢体语言的感知能力。这种感知能力的发展需要直接暴露在经历中——这些特征没法用语言指出来，因为”指出”这个动作本身就需要接收方已经能感知到被指的东西。

这造成了一个自举难题。专家无法传递模型，因为接收方缺少模型运转所依赖的感知类别；接收方无法发展那些感知类别，除非通过建立这些类别所需要的经历。教学可以通过引导注意力来加速这个过程（“看驾驶员的眼睛，不要只看车”），但替代不了它，因为这个指示只对已经开始发展相关感知敏感性的人有意义。

可传递性的层级

基于上述分析，知识大致可以按可传递性排列：

最易传递：事实与明确规则。“水在海平面 100°C 沸腾。“可以完整压缩进语言，可以通过教学完整传递。

次之：形式模型与框架。“净现值是折现后未来现金流的加总。“需要一定前置知识，但准备好之后可以完整传递。

再次：从经验中提炼的启发式规则。“警惕那些谈竞品多过谈客户的创始人。“可以部分传递，作为引导接收方进行校准的注意力指针是有用的，作为独立规则则容易误导，因为例外和规则一样重要，而例外无法枚举。

最难传递：感知校准本身。感知哪些特征重要、在特定情境中如何权衡它们、识别这个情境与表面相似的其他情境之间的细微差异——无法通过任何语言信道传递，只能通过在某个领域长期、有充分反馈的实践中习得。

正规教育体系几乎完全在前两个层面运作。学徒制主要在第三个层面。第四个层面只有在完成学徒制之后通过独立实践才能获得，这就是为什么即使是受过最好训练的专业人员，在毕业后也需要多年实践才能形成真正的专家判断力。医学界用住院医制度承认了这一点。其他大多数领域假装从可传递层面毕业就已经足够，这就是为什么那些领域的实际表现系统性地低于其正规培训的质量。

组织层面的后果

这对组织如何处理专业技能的影响是严峻的。

当组织试图通过编码把判断力领域去技能化——通过框架、检查表、决策树和流程文档——他们实际上是在尝试把第四层知识（感知校准）压缩成第二层知识（形式模型和框架）。这种压缩是有损的，而且有损的恰恰是真正重要的那部分：它保留了可传递、可读的组成部分，丢掉了不可传递、才是专业价值真正来源的组成部分。

然后组织用在第一、二层训练过的人来操作这套编码系统，这些人勤勉地应用框架，在常规案例里产出合格结果。被替代的专家看着这套框架，看到了它缺失的一切——每一个被忽略的交互效应，每一个它无法编码的感知特征。组织看着这套框架，看到了一个成功去技能化的功能，以更低成本运行，产出更一致的结果。两种观察都是准确的，但在量不同的东西：组织在量框架为之设计的那些常规案例上的表现，专家在量那些框架无法处理的非常规案例里积累的脆弱性。

解决方案只在一次非常规案例产生灾难性失败时短暂出现。然后，所有人短暂地同意专家判断力被低估了。开展审查，提出建议。建议不可避免地采用额外规则和框架的形式，因为那是组织能处理的唯一知识形式。规则被加进编码系统。系统变得更复杂、更脆弱、更不能处理下一次非常规案例——而下一次和上一次会以新规则无法预料的方式不同。循环重复。

正确的结论，对任何投身于知识形式化项目的人来说都是令人不舒服的：人类专业技能最有价值的形式，恰恰正是最抵制形式化的那些。它们可以习得但无法教授，可以获得但无法传递，可以展示但无法表达。每一次把它们压缩成可传递格式的尝试，都会销毁使其有价值的那些信息。唯一可靠的发展这些技能的方法——长期的、有足够反馈的直接经历——正好是那个无法被规模化、无法被标准化、无法被显著加速的方法。

聪明人可以指给你看方向，但带不了你走。走过去这件事，需要你的神经系统亲自完成，一次有反馈的重复接着一次。

参考

Why the Most Valuable Things You Know Are Things You Cannot Say – Dead Neurons