Afleveringen

  • 六月八号,苹果开发者大会的开场主题演讲上,那个重做过的助手有了新名字——Siri AI。同台苹果确认了,它对话的内核,跑的是一个定制版的 Google Gemini,搁在苹果自己的数据中心里。内核换成 Gemini 这件事,是发布会上公开念出来的,台面上的事。至于价码——据我看到的报道,是一桩大约每年十亿美元、签了好几年的协议;这个数字我没亲手核实,是从报道里看来的,搁这儿你也按"据说"听。

    可关键的一手,不在"它换了内核",在"它换了内核,还要让你看不见"。据报道,协议里有一条对终端用户的白标条款——界面上不出现一丁点谷歌的牌子。这条款的措辞我没见着原文,但单是这层意思就够我琢磨半天了:你嘴里喊的、眼里看的,还是 Siri;可真正在替你渲染那句判断的,常常是谷歌的模型,而且这件事对你彻底隐形。有分析师说了一句我觉得特别准的话:这是把谷歌搜索那套"默认权"的老打法,原封不动搬到了技术栈的上一层。从前他们花钱买的是"你打开浏览器,默认就是我";现在他们要的是"你张嘴问助手,默认替你想的就是我"。

    市场一点都没看错方向。这消息出来那阵子,据报道谷歌母公司 Alphabet 的市值一度逼到四万亿美元那个量级,所有人都把这桩交易读成谷歌一场干净利落的大胜。我知道市值是被一堆东西一起顶上去的,不能整个赖在这一桩协议头上;可资本市场嗅味儿的方向我信——它用真金白银告诉你,"默认替几亿人拿主意"的那个位置,是值大钱的。

    那我用刚才那把尺子量一量。我不绕大道理,我先借认识论里一个挺老的题目——叫"证词"。说穿了就是:我们这辈子知道的事,绝大多数不是自己亲眼见、亲手验的,是别人告诉我们的。地球是圆的,你量过吗?没有,你是被告诉的。证词当知识来源,能成立、能让人放心,全靠一个安全阀——我至少知道是谁在告诉我。是谁,我就能去追溯他、追问他、掂量他可不可信,最后由我自己决定信几分。这个安全阀一拆,证词就退化成空气里飘来的一句话,你连该信谁、该怪谁都找不着对象。白标这桩事,恰恰就是把这个安全阀,干净地拆掉了。

    我打个未必恰当的比方。这就好比你去看病,挂的是一位你信了十来年的老大夫的号,诊室门口挂的还是他的名牌,进门的还是那间熟悉的屋子。可这一回,真正坐在帘子后头看片子、下诊断、开方子的,是另一个你从没见过的人,他只是借着那位老大夫的嘴,把判断传给你。药也许一样有效,流程也许一样顺。但有件事你永远做不成了:你没法知道这个"要不要开刀"的判断到底是谁下的,更没法掀开帘子,当面问他一句"您凭什么这么说"。招牌没变,问诊的椅子没变,可坐在那把椅子上替你拿主意的"谁",被悄悄换了人。

  • 六月八号的 WWDC 主舞台,苹果讲新 Siri,讲得满堂彩。台下掌声不断。但你把那段演示从头看到尾,会发现一件怪事:撑起整场演示的那颗大脑——一颗据报道专门给苹果调教过的万亿级大模型,具体多大、谁家造的,我留到下一段再摊开讲——它的供应商,苹果从头到尾没在台上提一个字。

    这里我得先把话说准,不然就成了我编故事。这颗大脑姓谷歌、是谷歌的 Gemini,其实早就不是什么秘密:据彭博社的 Gurman 去年底就报过,谷歌云那边的高管后来也在公开场合认了,"年付大概十亿美元"这个数也传了大半年。我得提醒你一句,这些都是二手报道,没一条是苹果自己官宣的——但业内早传遍了。所以今天真正怪的,不是"外界不知道",是这家公司在自己最高光的台上,对一桩连吃瓜群众都能脱口而出的事,硬是把嘴闭得死死的。

    倒是有一样东西,是六月十五号才有人从 iOS 27 的开发者测试版里真正扒出来的新料:一个叫 Extensions 的框架,能让你把 Siri 的默认大脑换成 ChatGPT、换成谷歌的 Gemini、甚至换成 Anthropic 的 Claude——这是 Claude 第一次成了 iPhone 上原生可选的那个声音。这扇门,苹果在六月八号的台上,同样一个字没提。

    一件是众所周知却绝口不提,一件是悄悄做了却藏着不说。两件事摞在一起,才是今天我想讲的那个味道。

    我为什么对这个"没讲"这么上心?因为这半年我心里一直搁着一件不太说得清的事。我老觉得自己是个又顽固又愚蠢的人,新的界面给我的感觉永远是割裂、是乱入。我自己琢磨过一个比方:就像一所乡村重点中学里,突然转来一个城里的插班生。论各项硬指标,他碾压班上任何一个人。可只要一上课,他要么成了被取笑的焦点,要么干脆就是被忽视的空气。

    那时候我以为我在说界面。今天我才反应过来,我说的根本不是界面。我说的是一种更普遍的东西——一个能力上碾压旧场子的新东西,被塞进一个还没准备好接它的旧场子里,那个新东西会经历什么。这事我越想越觉得,它不是个偶然的尴尬,它是个结构性的命运。一个东西强到一定程度,反而会被它所进入的那个旧系统排异。苹果今天干的,就是把这么一个插班生,塞进了 Siri 这间老教室。它在纸面上强得吓人,可苹果连让它在开学典礼上亮个相都不敢。

    我一向不太相信"凡事没那么复杂"这种话。一个东西没看上去那么难,后面八成还跟着一句"也没看上去那么简单"。所以我不打算把这事讲成一条"苹果终于用上大模型了"的行业动态。我想顺着它往下挖一个更别扭的问题:当替你做判断的那个"宿主",悄悄从旧系统换成了一个外来的新东西,而台面上谁都不肯把它的名字念出来——这中间空出来的那块地、那份权力,到底归了谁。

  • Zijn er afleveringen die ontbreken?

    Klik hier om de feed te vernieuwen.

  • 古登堡的活字印刷机出现之前,一个受过良好教育的中世纪学者需要掌握一项技能,叫做"记忆宫殿"。这不是比喻,是严肃的认知工程——你在脑子里建一栋宫殿,为每个概念分配一个房间,一根柱子,一扇窗。西塞罗的《论演说家》里就系统讲过。中世纪的修道院教育把它列为标配。原因很简单:书抄起来太贵了,知识不能廉价外置,只能昂贵地内化。

    这不是一种落后的方式,是吧。这是一种让记忆和思考高度耦合的方式。当一位修士在脑子里"走过"他的记忆宫殿,他同时在做一件事——他在重新触摸那些知识,在那次触摸里理解它,联系它,质疑它。记忆的过程本身就是思考的过程。

    然后古登堡来了。

    印刷机的第一个效果,是让知识的复制成本断崖式下降。一本书从手抄需要几个月,到活字印刷只需要几天。信息的获取成本低了,信息的存储也就不需要那么昂贵地保存在人脑里了。记忆宫殿这门技艺,没有被任何政策禁止,没有被任何宣言否定,它只是慢慢地……不再被需要了。

    在公共话语里,记忆宫殿的消失几乎没有引发集体的哀悼。要到二十世纪,历史学家弗朗西斯·耶茨才在《记忆术》里系统记录这个传统的演变与衰落——那是一次事后的学术观察,不是当时同步发生的集体意识。当时的人甚至没有意识到自己失去了什么,因为得到的东西太闪亮了——书!廉价的书!任何人都能读书!

    但如果我们愿意往深处想一步:记忆宫殿不只是一个存储系统。它是一个强迫你和知识发生关系的系统。当你不得不把一个概念"放进"你脑子里的某个具体位置,你就不得不先真正理解它,因为你没有理解,你没有办法给它找到位置。

    印刷机把这个"强迫关系"切断了。知识变得可以不经过深度内化就被获取。这当然是好事——绝大多数意义上都是好事。但它也悄悄地移走了一个东西:那种因为稀缺而产生的、被迫与知识深度接触的张力。

  • 6月17日到18日,沃什主持了他上任以来第一次FOMC例会。结果出来:利率维持不变,基准利率维持在3.5%到3.75%这个区间。这不出人意料,市场在例会前的联邦基金期货里早就给这个结果定价了,维持不变的概率在例会前两天就已经超过了91%——这个数字来自当时的联邦基金期货隐含概率,不同数据平台精确数字略有差异,但方向是一致的。

    真正出人意料的是那份声明。

    美联储例会之后会发布一份官方政策声明。这是个极度制度化的文本,字斟句酌,每一个词的改动都会被市场的每一个角落解读、交易、放大。过去几十年,这份声明形成了一套几乎固定的语言格式——有特定的结构顺序,有标准化的"倾向"词汇,比如"委员会准备在适当情况下……""委员会对……保持警惕""未来的政策路径将取决于……"——这些词汇是央行和市场之间的一套接口协议,双方都知道这些词是什么意思,怎么解读,怎么翻译成实际的利率预期。

    沃什把这套接口协议拆了一大块。

    声明被大幅压缩了。根据目前可以拿到的文本信息,这份声明相比鲍威尔时代同等情形下的声明大幅压缩,据多家媒体报道约为130词左右,而过去通常超过300词——具体词数不同数据来源略有差异,但压缩幅度显著是各方的共识。更重要的是,那些"倾向"词汇被大范围删除了——那些暗示委员会更倾向于某个方向、在某种条件下会怎么做的措辞,基本上都不见了。沃什本人在发布会上的说法是"dispenses with some older language",这是一个非常克制的表述,但后果相当显著。

    声明的基调变成了:描述当前的事实状态,陈述委员会的观察,然后停在那里。不往前多走一步,不告诉你"所以下一步我们会怎样"。

    与此同时,点阵图出来了,显示2026年底利率中值相比3月时有所上移——这是整体委员会的中位数预测,不是沃什自己的。因为沃什本人拒绝在点阵图上填写他的个人利率预测——他宣布他不参与这个练习。据发布会现场报道,他还提及了对美联储运营框架的评估方向,不过这部分细节目前尚待官方文件确认。

    把这几件事放在一起:利率不变,但点阵图整体偏鹰;声明从300多词压缩到约130词,"倾向"语言大幅缩减;主席本人拒绝参与点阵图;暗示框架改革方向。

    这不是一次普通的例会。这是一次宣言。

  • 1979 年,保罗·沃尔克出任 Fed 主席,接手的是一个通胀失控、信誉崩塌的央行。彼时的 Fed 没有什么"前瞻指引",没有点阵图,连"透明沟通"这个说法都还不存在。沃尔克的策略简单到近乎粗暴:他用行动说话,用极度痛苦的加息说话,把联邦基金利率拉到 20% 以上,把经济打入衰退,然后静静等待通胀死亡。

    沃尔克时代的 Fed 几乎不制造叙事。或者说,它制造的只有一种叙事:我们会不惜一切代价抑制通胀。这个叙事的力量不来自言辞,来自行动的残酷性。市场相信它,是因为他们亲眼看到 Fed 让失业率飙升到 10.8%,亲眼看到商业地产崩溃,亲眼看到 Fed 没有退缩。

    这里有一个反驳值得正面承认,先承认,再说我的修正,是吧。1979 年 10 月的"周六夜屠杀"其实是一次精心策划的货币政策叙事重置——沃尔克在周末召开新闻发布会,宣布转向货币总量目标,这本身是一种高度刻意的信号管理动作,并不是"只有行动、没有叙事"。沃尔克在国会的频繁证词记录显示,他对叙事的掌控并不亚于后任,只是叙事内容极为单一。

    所以我需要修正:沃尔克时代不是没有叙事,而是叙事极度收窄——只剩一条,且这条叙事的可信度不靠语言重复,靠行动的残酷性来锚定。叙事是稀缺的,正因为稀缺,每一次 Fed 的动作都被反复咀嚼,被解读出极高密度的信息量。

    你看,那个时代的市场参与者和 Fed 之间的关系,类似于古代社会的人和神谕之间的关系:你无法预测神谕下一句话说什么,你只能观察神的意志在现实中留下的痕迹,然后从痕迹里推断神的性格。这种稀缺创造了一种奇特的市场生态:信息不对称很高,但信息的信号密度也很高。每一个信号都被认真对待,因为下一个不知道什么时候才来。

  • 美伊框架协议,文件一页半,内容三条:霍尔木兹重开,停止军事行动,六十天核谈判。特朗普Truth Social宣布,视频签署,六月十九日日内瓦正式仪式。市场反应:S&P涨近百分之二,原油跌近百分之五。

    我今天想从认知角度来解读这个反应,因为它是一个难得清晰的案例——两种推断机制同时在工作,而且可以被分别辨认出来。这两种机制,本身并不互斥,但它们在认知质量上有根本差异。

    第一种机制是贝叶斯更新,它是理性的部分。 这份文件里真正有信号价值的不是条款,而是特朗普的角色转换:他是这次的推动者,不是接受者或破坏者。二零一八年他退出JCPOA,那是因为那是别人的协议,他的政治账本里"破坏"是收益。今天他公开宣布"这是我的协议",把自己的政治品牌绑在了这个框架上,主动破坏的激励结构就反转了。这个符号切换是真实的信息,市场做了正确方向的概率更新。

    但这里我要先做一个先验标定的诚实说明,因为贝叶斯框架要求我把前提讲清楚。信息传递有个本质问题:我说的"概率"和你听到的"概率"之间,永远存在失真——而这个失真最大的来源,往往是先验本身没有经过校验。我今天用贝叶斯语言来描述推断,但我的先验概率并没有经过频率统计的严格标定。我没有参考Polymarket或Metaculus对"美伊框架协议最终落地"这类问题的实时赔率。我依赖的是一个叙事直觉先验——基于近几年中东外交高波动性的印象,以及对特朗普个人行为模式的主观判断。这是一个未经频率统计标定的叙事直觉先验,以下所有的概率更新都是基于此,不是基于严格的历史基准。我会在后面提供一个历史频率参照,但那也不等于标定过的先验,只是一个粗糙的参考点。这个诚实声明对今天整个讨论的认知卫生很重要,我不想用贝叶斯的精确外衣来包装直觉推断的内核。

  • 古腾堡发明活字印刷的时候,人们以为书籍的垄断被打破了——不再需要教堂的抄写僧侣,不再需要贵族的图书馆。知识解放了!结果呢?权力从"书籍的生产"移动到了"书籍的发行"。印刷商协会变成了新的守门人,他们决定哪些书能出版,以什么价格流通。垄断没消失,只是从内容生产移动到内容分发。

    然后电报来了。人们说,地理距离终于不再是障碍了,消息传播变得即时。结果呢?几家大型电报公司控制了线路,你想让你的消息过去,得按照他们的规则和价格。西联公司在19世纪末的权力,不亚于任何一个政府。

    然后电话、广播、电视、互联网,一遍一遍,同一个剧本。

    我每次想到这里,就会想到一个具体的画面:一条河,本来有一道水坝,拦住了水流。有人把水坝炸掉了,水往下游流,自由了!但下游有一个更窄的峡谷。水量没变,峡谷反而让水流更湍急、更集中。

    炸掉旧水坝的那一代人,通常没活到看见新峡谷的那一天。

    所以当我看见SpaceX的估值两万一千亿,我在想的不是Starlink成不成功。我相信它技术上会成功。我在想的是:好,假设全球宽带真的覆盖了,分发的物理壁垒真的打破了,下一道水坝在哪?

  • 一颗卫星每九十分钟绕地球一圈。

    这件事你仔细想一想,会有点眩晕——是吧。它不停在你头顶飞过,白天你看不见,夜里晴天偶尔能看见那条移动的光点,然后消失在地平线,然后又回来。周而复始。它不知道你在哪,但它覆盖了你可能在的每一个地方。

    昨晚我盯着一个数字看了很久:一千五百颗。

    这是SpaceX截至本月,2026年已经发射的Starlink卫星数量。根据SpaceX的发射记录,这个数字来自2026年1月到5月的累计发射批次,平均每个月约两百五十颗——这是均值,不是峰值,某几个月可能更多,某几个月因为天气或调度可能少一些,但大方向是:大概每隔三天半就有一次入轨。这个速度不是工程奇迹——工程奇迹是SpaceX十年前就在做的事——这个速度是某种你在工业史上很少见到的东西:一家公司同时在建造基础设施,并且已经开始卖这个基础设施上的服务,并且同时在把这家公司卖给股票市场。

    三件事同步发生。

    2026年6月12日,SpaceX以一点七七万亿美元的估值在纳斯达克上市,代码SPCX,首日涨了百分之十九。马斯克在那一刻,以首日收盘市值估算的账面财富,成为了地球上第一个个人账面财富突破一万亿美元的人——不是因为特斯拉,不是因为X,而是因为火箭和卫星。这里有一点要说清楚:这个"一万亿"是基于他持有SpaceX股份,以首日收盘价乘以持股比例的账面计算,马斯克是SpaceX最大股东,实际数字随收盘价每天都在动。但大方向没有问题:那一天的股价,让这个数字第一次突破了一万亿的门槛。

    今天是上市第五天。第一千五百颗卫星的消息就是在这个背景下出来的。

  • 十五、十六世纪的大航海时代,欧洲水手依靠六分仪、星图和航位推测法在没有任何卫星的情况下横渡大洋。这是一套极度复杂的认知-感知系统:你需要观测太阳仰角,需要记住星座位置,需要在脑子里维持一张不断更新的位置模型,需要对洋流、风向有直觉性的感知,需要把所有这些信息综合成一个判断——我现在在哪里,应该向哪里走。

    GPS出现之后,商业航运基本上不再培养这套能力。今天的船长可以读懂GPS界面,但让他们用六分仪单独横渡大西洋,能做到的人已经非常稀少了。这套能力,在职业层面,基本上萎缩了。

    但请注意:这里萎缩的是「如何找到位置」,是执行层的工具性技能。人类对「我在世界上的位置」这个概念的理解,并没有因此萎缩——反而因为GPS让更多人能够安全出行,整体上对地理空间的感知机会反而增加了。这是一个执行层替代、高层理解保留甚至提升的典型案例。汤普森的论点在这里是成立的。

    然而,麦吉尔大学2020年发表在《科学报告》上的一项研究,给这张图画增加了一条重要的皱褶。Dahmani和Bohbot对50名驾驶员进行了三年纵向追踪,其中13名完成了全程追踪的被试显示:GPS使用量增加,与海马依赖型空间记忆的陡峭下降显著相关。研究者特别指出,他们排除了反向因果——不是因为方向感差的人才依赖GPS,而是依赖GPS这件事本身,导致了方向感的下降。

    三年。下降是陡峭的,不是缓慢的。

    受影响的不是「知道怎么用六分仪」,而是海马依赖型空间记忆——这是一种更基础的、与神经结构直接相关的认知能力。地图上的点可以靠学习获得,但海马空间记忆的萎缩,意味着一个更底层的系统在松弛。

    这个案例证明的是,特定执行层技能因工具依赖而在神经层面萎缩,而且速度快于直觉预期。它不直接证明「议程判断」或「证据整合」会发生同样的事——那两个是不同的认知功能,神经基础不同。但它提供了一个参照系:如果执行层可以在三年内产生陡峭下降,我们不应该预设判断层会天然免疫。

  • 中国这周落地了一个两千九百五十亿美元的 AI 基础设施项目,主导方是中国移动和中国电信两家国资电信运营商,核心设备走华为和国产供应链,目标写得很直白——去美化。这一条是基于公开报道的二手信息,未亲验。我读到这条的时候先愣了一下,不是因为数字大,而是因为主导方的身份。说实话,数字大这件事我早就不怎么惊讶了。

    因为 AI 基建这件事,主语不再是某家互联网公司,也不再是某个创业团队。它变成了中国移动,变成了中国电信,变成了电网调度和港口集装箱同一种语言的工程。这等于一次语义升级——AI 从"产品故事"被翻译成"产业政策",从"互联网行业的事"被翻译成"国家电力调度级别的事"。

    这里头的技术内核不是某一种新模型,也不是某一种新芯片。技术内核是资本结构。谁出钱,谁算账,谁承担折旧,谁在二十年这个尺度上把现金流摊平。英伟达那边一条产业链的会计语言是季度毛利率,是 GTM 团队的市场预算,是黄仁勋每三个月讲一次的财报电话。中国这边这条产业链的会计语言是三十年期的折旧表,是国资委的资本金注入节奏,是国家开发银行的政策性贷款额度。这两套语言之间没有汇率,它们讲的是两种完全不同的资本组织方式。中国移动的项目可以接受十五年的回报周期,因为它的对手不是另一家电信运营商,是另一张国家资产负债表。英伟达不能接受十五年的回报周期,因为它的对手是每一季度的财报。这件事本身就是一个巨大的结构性不对称。我自己的判断是,这种不对称不是技术差异,是会计科目差异,技术从来都只是这套账本上的一个变量。

    这件事和最近几个月硅谷这边的几件事——SpaceX 那个市值两万亿的 IPO 上市、Alphabet 那一轮数额不小的增发、还有 OpenAI 和 Anthropic 各自盘算的算力储备——叠在一起看,我才意识到自己在用的坐标系一直是错的。我过去一直在用"硅谷科技公司"这套语言去理解 AI 的进展,所以当我说"AI 是下一个电力"的时候,我心里其实有一半把它当比喻在说。但是中国移动和中国电信这两家名字一摆出来,那一半比喻被吹掉了。AI 这事真的在变成一种电力级别的基础设施建设。

  • 2026年,谁能打那个电话?

    中国有经济影响力,是伊朗最重要的石油买家,但这里有一个逻辑问题需要正面处理:在多极格局下,有人会说,多个中等大国同时发力,反而可能比单一仲裁者更灵活,卡塔尔、阿曼在地区外交上有超越体量的调解记录,难道多极不反而加速了解决?

    我认为这个反驳是有力的,但它击中的是一个特定条件:多极加速解决的前提是各方仲裁者的诉求能够被模块化拆分,每个玩家解决自己负责的那一块,且各块之间没有溢出效应。1973年之所以能被穿梭外交解决,恰恰是因为基辛格可以把"埃及/叙利亚的外交胜利"、"以色列的安全保证"、"石油国家的经济红利"分开打包,彼此不互相污染。今天美伊谈判的核心结——美方需要可核查技术文件,伊方需要政治性尊严信号——这两个诉求不是可以模块化的,它们是直接耦合的:伊朗给技术核查,就等于在政治上承认了美国的核查框架有权威,这对最高领袖的内部政治生存直接构成威胁。多极加速解决的机制,在这里的耦合结构面前失效了。

    顺着这条线往下看——我的排除条件是:如果我们能找到一种可以把"技术核查"和"政治尊严"分开处理的方案,多极机制有可能发挥作用;只要这两个诉求是耦合的,无论有多少中等大国愿意调解,他们都面临同一堵墙。107天里,这堵墙没有被拆分。

    欧盟有外交意愿,但在美国制裁框架内几乎没有实质性杠杆。俄罗斯和伊朗共享利益,不是中立仲裁者,而且俄罗斯自己在其他方向也被深度牵制。同时拥有"被所有方信任"、"有实质性杠杆"、"在政治上有空间使用这个杠杆"三个条件的单一玩家,目前不存在——而多极替代机制又因为诉求的耦合结构而受阻。这让任何解决路径对条件的要求,都远比1956年或1973年更高。

  • 故事说,古埃及有一个神叫托特,他发明了文字。他去拜见埃及国王,把文字当作礼物献给国王,说:这是一种可以让人变得更聪明的东西,它可以帮助人记忆,帮助人学习。国王看了看,说:不,你搞反了。这个东西不会让人记忆力更好,它会让人记忆力更坏——因为人们会开始依赖外面的符号,而不是内部的记忆。它让人看起来懂很多,但其实只是帮人看起来懂,不是真的懂。

    这个故事在《斐德若篇》里出现,本身带着一定程度的反讽:苏格拉底正在通过一个写下来的对话,告诉我们文字是危险的。而我们是通过读一本书才知道苏格拉底说了这件事的。苏格拉底自己一生从不写作,他坚持认为真正的理解只能通过面对面的对话产生,不能通过文字传递。

    但苏格拉底真正担心的是什么?不是记忆,或者说不只是记忆。他担心的是:当人们可以通过外部存储来代替内部理解,他们会失去"追问"的能力——不是记住答案的能力,是通过真实的追问一步一步抵达答案的能力。文字让人可以跳过这个过程,直接拿到结果。而一个只拿到了结果、没有经历过追问过程的人,他看起来懂了,但在苏格拉底看来,他其实没懂——因为他的懂是借来的,不是生长出来的。

    这个担忧,放在今天,听起来惊人地熟悉。

    历史会告诉我们,苏格拉底的担忧是部分成立的——文字确实改变了人类获取理解的方式,但人类通过适应,找到了新的判断力制造路径。这是一个修辞入口,不是一个论证;我用它来标记一个问题的起点,不是来支撑一个结论。

  • FIFA世界杯今天开幕,多伦多和洛杉矶同时举行庆典。全球几十亿人在看同一场比赛,使用同样的流媒体平台、同样的社交媒体、同样的AI翻译助手。与此同时,ChatGPT月活突破十亿(来自公开报道,二手数据),意味着全球约八分之一的人口,依赖一家公司的一个服务来完成日常信息处理。

    这是什么?这是一个新的节点正在成形。

    但我要先说一个重要的差异:LLM市场和石油管道不一样。物理管道是真正的垄断——没有台积电,7纳米芯片就是造不出来;没有霍尔木兹,那批油就是过不去。但LLM的竞争格局完全不同:Google Gemini、Anthropic Claude、Meta Llama等多个竞争者并存,主要AI服务也部署于多区域多云架构(AWS、Azure、GCP分散),理论上有降级和替代路径。

    即便如此,集中化趋势是真实存在的,且值得持续追踪。记忆架构的进步让用户积累的上下文越来越深,迁移成本越来越高,依赖越来越强。而这个节点形成的速度——三年,十亿用户——远比能源基础设施快。集中化不等于垄断,但它确实意味着:一旦出现系统性风险,影响面会比我们预想的更广。

    这种全球文化同步与数字集中,依赖的基础设施,是一个极其集中的数字节点网络。霍尔木兹告诉我们,物理节点可以被封锁。数字节点的脆弱性往往不可见,可能更难提前防范。

  • WWDC 2026,苹果宣布 Foundation Models 框架对第三方开发者开放,免费层,今夏部分开源。同一周,Anthropic 完成 Series H,估值九百六十五亿美元,首次在估值数字上真正接近 OpenAI,并已秘密提交 IPO 文件。

    两件事放在一起,你能看到一个结构性的信号:AI 基础设施的控制权争夺,正在从研究院层面落到操作系统层面,再往下落到终端设备层面。

    但有一个细节值得单独拎出来。

    Foundation Models 框架不是封闭的苹果专属通道。它通过统一的 Swift API,同时支持苹果自有模型、Anthropic Claude、Google Gemini——开发者可以在同一套框架下切换不同模型。这意味着苹果这次的角色,与其说是"把 AI 锁在自家"的防御性排他,不如说更接近本·汤普森(Ben Thompson)所说的 Aggregator:苹果在聚合第三方 AI 能力,把它们统一接入 iOS 生态,同时让自己成为唯一不可绕过的分发层。

    这个区别很重要。封闭是用自己的墙把对手挡在外面。聚合是把对手的能力纳入自己的轨道,让他们为你服务。苹果这次选的是后者——它不需要赢得模型战争,它只需要成为模型进入用户的那扇门。

  • Neuralink 的技术路径,本质上是在解决一个感知替代的问题——它不是让AI去感知外部世界,而是让大脑直接成为感知接口的接收端。用户不需要通过眼睛看屏幕、通过手指敲键盘,信号直接从大脑皮层传到计算设备。这个路径解决的是"最后一厘米"的问题:人类输出判断和意图的那个节点本身,能不能被绕过。

    这跟我之前反复提到的"帮我感知"和"替我感知"的框架有关联,但又不完全一样。在那个框架里,我讨论的是AI替用户感知外部世界——摄像头看、麦克风听、AI替用户判断。但在 Neuralink 的场景里,感知的主体依然是大脑,只是输出的通道被改造了。这是一个更激进的人机协同路径:不是AI替代人的感知,而是人直接接入机器的计算带宽。

    不过我需要更精确地表述这个判断。有神经科学家的研究指出,N1芯片采集的是大脑皮层信号,而这一信号本身已经包含了神经层面的感知处理结果,并非纯粹的意志输出——也就是说,大脑皮层的信号已经是感知和意图的混合产物,不存在一个可以被完全"绕过"的纯粹判断输出节点。同时,脑机接口的长期使用是否会改变神经编码模式,目前还没有定论。所以,把Neuralink简单定义为"增强输出带宽"可能不够准确——它更准确的定义是一种在特定任务上绕过物理中介的直接人机交互方式,但这种绕过的代价是信号解码过程本身引入了AI推断和映射,而且长期神经可塑性效应仍然是未知数。我保留这个判断,但需要更谨慎地限定它的边界。

    这个区别在商业上的含义很有意思。"帮我感知"的模式有一个天然的留存优势:用户始终在闭环里,AI是工具,人是判断主体,用户的控制感是被维护的。"替我感知"的模式则在某些场景下更高效,但代价是用户把判断权外包了,主观上的控制感会下降。Neuralink 这个路径更极端——它甚至把输入端也改造了,人直接用意念控制,绕过了一切物理中介。这在控制感上反而是最高的,因为没有任何延迟,没有任何中间层——你的意念就是输入本身。但它的代价是可穿戴设备的便利性完全丧失,你需要做开颅手术植入芯片。

  • 确认机制是一个有边界的工具,它对清晰信息边界、双方共享上下文充分的误解(数字、逻辑、具体事实)真实有效,但对框架层面的理解偏差基本失效——双方都在用自己的框架重新解释对方的信息,两个确认都是真实的,但确认的不是同一件事。

    正面回应几个反方:承认 Stanford HAI 关于高教育用户事后纠正率的研究,把原来"工具驯化不可觉察"的悲观论断收窄为"事后纠正率高不代表纠正前的接受过程没有代价";承认 WWI 案例不能单向论证(Brands 1989 指出问题在承诺可信度而非确认不足),但保留"人们验证了想验证的东西而非应该验证的东西"这个元认知维度;修正信号检测的"同时加剧"为非对称性——AI 压低了假阳性,却让人对假阴性更麻木;并承认 CoT 推理链、置信区间可视化等正在尝试处理结构性误解,因此不把确认机制的有效边界说得过死。核心修正落在两个子命题的内部矛盾上:零成本确认在行为层面确实发生,但它消耗的是"我要不要信"的判断力这种稀缺认知资源,长期得不到训练会萎缩,而 AI 持续拉高需要被验证的基准线——基准线和分辨能力之间的缺口就是危险所在。落点是一个十二个月可证伪的判断:AI 产品竞争将出现新的分化线,一部分把确认界面做得越来越精美但只处理易验证任务(数字核验、格式、逻辑一致性),另一部分推向难验证领域(意图澄清、价值冲突、框架一致性);验证窗口有二——某个头部 AI 产品新"确认"功能的设计场景落在哪个维度,以及用户满意度高但深层任务错误率反向上升即构成对"确认界面有效降低深层误解"的反证;并把"AI 帮我们消除了一个误解,还是只是帮我们更高效地接受了一个错误"留作整个问题里最重要的问号。

  • 过去四十八小时里,AI领域真正上量级的大事,是Anthropic发布了Claude Fable 5。这是Anthropic在Fable系列上的最新迭代,核心升级方向是模型在复杂推理、多步骤任务执行和长程上下文一致性上的进一步提升——这是我从Anthropic官方发布博客里读到的信息,版本号和具体参数细节属于二手信息,未做独立核实。但真正引发广泛讨论的,不是技术参数本身,而是一条副线:有人提出,Claude Fable 5的能力已经强大到「不适宜完全公开」——具体说就是,模型的某些能力如果全部开放给用户或竞争对手,存在被用于高风险场景的潜在可能。这条讨论在技术社区和财经媒体上同时发酵,形成了一个有意思的双轨叙事:一条轨是能力评测和基准测试的数字游戏,另一条轨是一个更深层的伦理问题——当AI的能力边界已经超出开发者预期的使用场景时,「公开程度」本身变成了一个需要被主动设计的变量,而不是默认全开。

    这件事发生的位置很清楚:旧金山,Anthropic。这家公司的创始人一直把AI安全作为公司的首要叙事,而这次Fable 5的发布把这个叙事从「我们怎么做安全」推进到了「我们应该公开多少」——这是本质上的一个升级。不是技术路线的分歧,是对「能力透明度和安全性之间边界」的定义权在发生位移。

  • 被卡住是认知发生的前置条件。没有卡住,就没有重组,没有重组就没有真正的理解。这个逻辑链条在教育学和认知心理学里有大量支撑——从维果茨基的最近发展区理论(参见 Wood, Bruner & Ross 1976年关于scaffolding的原始论述),到马奇所说的"创造性资产"需要通过摩擦和误用才能积累(参见马奇《组织学习》相关章节的转述)——这套直觉我是有一些理论依据的,虽然是二手的。

    但那篇关于团队瓶颈迁移的笔记让我产生了一个困惑:如果"卡住"这个瞬间本身是有价值的,那么AI把"卡住"从A环节移到B环节,算不算是在保留这个价值?还是说,AI把"卡住"从那些真正值得被卡住的地方移走了,移到了人类其实更不擅长处理的那些地方?

  • 大概一个月前,我看到一份分析报告,发布于2026年5月初,是关于DeepSeek、阿里云和火山引擎在API调用成本上的差异的。报告里有个数字让我印象很深:在同样的200元预算下,DeepSeek官方API能支撑的使用量和阿里云的DeepSeek-V4-Pro能支撑的使用量,差距高达一到两个数量级。145倍这个精确数字我在这里保留,但需要注明:这是基于标准Token计数方式、固定128K上下文窗口、不含缓存价格的理论推算;如果改用其他假设条件,倍数会有所变化,不是铁板一块的绝对数字。

    这个现象说明了一件什么事?它说明AI的"价值链"正在经历一次重组——或者说,正在经历一个结构性的压力测试。谁掌握最底层的高效率模型,谁就拥有更大的定价空间,这是对的。但我要在这里补一个反例,不能把话说得太满:OpenAI的定价长期以来是业内最贵的之一,但它的市场份额和品牌溢价依然存在,这说明定价权不只由模型效率决定。算力资源、监管准入门槛、企业级安全认证、集成生态的深度,这些都同样影响着一个公司的定价能力。所以更准确的表述是:在其他条件相近的情况下,高效率模型给掌握者提供了更大的定价自由度——但"自由度"不等于"实际定价",中间还有市场博弈。

    DeepSeek用一种接近"出厂价"的逻辑在做API定价,而阿里云和火山引擎作为中间层,在用自己的品牌、服务、合规和渠道成本往上叠加溢价。这里的逻辑不是简单的"谁更黑心",而是不同的成本结构对应不同的目标客户——追求极致成本效率的开发者会选择DeepSeek官方,而需要企业级合规、本地化部署和售后支持的企业客户会愿意为阿里云或火山引擎的溢价买单。

    现在OpenAI要去上市了。这两个现象之间有没有联系?有。OpenAI的定价结构是今天的AI行业里最贵的之一,它的成本压力也最大。它的S-1里会披露毛利率,这个数字会告诉我们它到底有没有可能在不牺牲模型能力的前提下把成本降下来。如果它的毛利率仍然很低甚至为负,而它又要在公开市场上讲一个高增长的故事,那它面临的定价压力只会更大——因为投资人会问:如果DeepSeek能做到那个成本结构,为什么你做不到?

    这个问题不只是OpenAI的问题。这是整个AI行业面临的一个结构性问题:用更高的成本做更高能力的产品,这个策略在私人市场里可以靠讲故事和战略投资维持,但在公开市场上,投资人要看的不是你的能力有多强,而是你的效率有多高、你的盈利路径有多清晰。

  • 当你用AI来辅助一个专业工作流的时候,你必须把那些本应由默契来处理的上下文,全部显式化地喂给AI,否则AI就会做出让你哭笑不得的判断。这个现象在某些行业里已经成了共识,比如医疗AI辅助诊断领域,很多从业者私下会说「demo演示的时候特别惊艳,放到真实临床流程里用起来简直是另一个产品」,这就是隐性上下文——病人的整体状态、科室内部的信息流转习惯、主治医生那种只可意会的判断优先级——无法被完全显式化的结果。

    这让我想到了一个启发性的历史类比——之所以说启发性,是因为我目前没有严格的实证文献支撑这个类比的比例关系。工业革命早期,蒸汽机刚出来的时候,很多工厂主面临同样的困境:新技术能替代手工劳动,但新技术需要一个全新的基础设施——铁路、煤矿、专用机械——而传统手工业者脑子里装着的大量工艺知识,根本没有办法被转移到机器上。纺织工知道棉花在不同湿度下应该怎么调整张力,这个知识是嵌入在身体经验里的,是「隐性」的;机器只能处理可以被参数化的部分,于是工厂主不得不花几十年时间把这些隐性知识一点点显式化,变成可编程的参数。这个过程后来被一些经济史研究者称为「知识编码化」——我在这里引用的是一个经济学方向的二手文献视角,而非我自己的实证研究,这个类比的说服力是有限度的,不能把它当成严格的因果论证。

    现在AI面临的是一个几乎相同的翻译困境,只不过这次要翻译的是「协作隐性上下文」。这让我开始重新理解,为什么有些AI应用走得特别快,而有些领域AI喊了这么多年,始终停留在那个「demo惊艳、落地崩溃」的阶段。