2026-04-11 · Bitcoin

中本聪是谁:NYT 调查的方法论批判

从 1 万小时写作习惯分析,到邮件元数据的沉默
中本聪 Adam Back 身份之谜 方法论

17 年了,全球最聪明的人花了无数个小时追踪中本聪的身份。最近,《纽约时报》的一篇调查把矛头指向了 Blockstream 联合创始人 Adam Back。这篇文章我想从方法论角度,认真分析一下——这轮调查的说服力到底有多强。

一、调查者用了什么方法?

先把立场放一边,客观说这篇调查用了几种不同的分析手段,每种手段的可靠性差异很大。

1. 文体计量学(Stylometry)

这是语言学里用来识别作者身份的技术,通过统计高频功能词(the、and、of)的使用频率来建立风格指纹。调查者请了法国计算语言学家 Florian Cafiero 做了两轮分析:

结论:互相矛盾,两轮都没能给出明确结论。这个工具的局限在于——如果对方知道 stylometry 的原理,是可以刻意调整写作风格的。事实上,Back 本人在 1998 年的一篇帖子中就提出过"多项选择式句子构造器"来规避风格识别。所以这个方法对有反侦察意识的人是打折扣的。

2. 连字符使用错误的统计分析

这是整篇调查中最有意思的部分。调查者发现了 325 处中本聪在语法性连字符使用上的错误,然后与 Cypherpunks 邮件列表上 620 名活跃用户的写作进行比对。

结果:Back 与中本聪共享了 67 处完全相同的连字符错误,排名第二的候选人只有 38 处。这个差距是显著的。

我的判断:这是整篇调查中最扎实的一项证据。连字符使用习惯属于"无意识写作行为",很难刻意伪装,也没有明显的功能性目的。你不会因为想隐藏身份就特意把 "proof-of-work" 加上连字符。这种习惯更像是下意识的。

3. 邮件列表发帖行为模式分析

调查者从三个 Cypherpunks 相关邮件列表中提取了 2008 年 10 月之前的全部帖子(约 13.4 万篇),通过层层筛选(过滤垃圾账号、会话量不足者、未讨论过数字货币者),最终锁定到 620 名候选人。

然后做了一件事:找出中本聪全部文本中"没有同义词的技术词汇",看谁使用过最多这类词。Back 以 521 个共享词汇排名第一。

我的判断:这个方向是对的——用技术词汇代替高频功能词,可以规避 stylometry 的弱点。但问题在于,Back 本身就是 Hashcash 的发明者,他在邮件列表中大量讨论相关概念是理所当然的,所以这个数字高本身并不意外。

4. 关键概念的预言式提前出现

这是整篇调查最吸引眼球的部分:Back 在 1997-1999 年间,就在 Cypherpunks 邮件列表上几乎完整描述了 Bitcoin 的所有核心要素:

而这些观点,中本聪在 2008-2009 年几乎用完全相同的逻辑重新表述了一遍。

二、反方观点:为什么 Back 不可能是中本聪?

行业内的反驳声音同样值得认真对待。Nothing Research 合伙人 0xTodd 提出了三点质疑:

质疑一:邮件请教语气

2008-2009 年间,中本聪曾主动联系 Adam Back 请教技术问题。如果 Back 就是中本聪,这个互动显得刻意且多余。

质疑二:代码实现风格

Bitcoin 早期代码的编程风格与 Back 的习惯存在可识别的差异。代码风格是比写作风格更难伪装的东西。

质疑三:动机矛盾

Back 持有约 100 万枚 BTC 的前提下,后续在 Blockstream 的商业化路径在动机上难以自洽。如果要隐姓埋名,为什么还要高调创办公司并主导 Bitcoin 发展方向?

质疑四:当面否认

Back 本人在 HBO 纪录片和纽约时报采访中均明确否认,并表示后悔没有更早挖矿。

这四点里,动机矛盾是最有分量的。代码风格差异如果经过独立代码审计支持,也会很有说服力(但目前没有看到完整的审计报告)。当面否认的效力最低——说谎的人当然会否认。

三、最值得关注的一个疑点

在整个调查过程中,有一个细节让我觉得值得深究:

最值得追问的疑点

中本聪在 Bitcoin 白皮书中同时引用了 Hashcash 和 b-money。但根据 Craig Wright 庭审中公开的 Back 与中本聪邮件,中本聪似乎是在 Back 让他去看 Dai 的网站之后,才知道 b-money 的存在的。

但 Back 的 Hashcash 论文中明确提到 b-money 是其应用场景之一。如果中本聪读过自己要引用的论文,不可能不知道 b-money。

调查者提出了一个合理的推测:这些邮件可能是 Back 自己写给自己的,用来制造掩护性叙事。而 Back 拒绝提供这些邮件的元数据(发件时间、IP 来源等),这一点本身就很值得玩味。

如果邮件是真的——Back 就是无辜被联系的人。

如果邮件是伪造的——那 Back 的嫌疑就大幅上升。

在元数据被公开之前,这个疑点无法被排除。

四、证据说服力评估

连字符使用习惯匹配(67 vs 38)
强有力
1997-1999 年概念预言
较强
无同义词技术词汇匹配
中等
文体计量学结果
不确定
邮件元数据缺失
增加疑虑

五、我的判断

一个法证调查者的诚实结论

作为读者,我读完这篇调查的整体感受是:证据指向性确实明显,但还达不到"定论"的程度。核心问题在于,调查者使用的工具(stylometry)被它自己否定了自己的结论,而最有力的证据(连字符习惯)在统计意义上显著,但这类统计永远存在"巧合"的解释空间。


真正让我觉得这件事值得继续关注的,是 Back 对邮件元数据的沉默。数字取证不是玄学,一封邮件从哪台服务器发出、经没经过 Tor 转发、有没有被修改过——这些都是有迹可循的。如果 Back 真的没有问题,给出元数据是最简单的自证清白方式。


当然,这件事可能永远没有答案。中本聪持有约 100 万枚 BTC,按当前价格超过 1000 亿美元。这个利益足够大到,任何真正的中本聪都会把身份带到坟墓里。而我们能做的,只是在这些留下来的文本碎片中,继续寻找那个始终隐身的影子。

最终观点

Back 是目前所有候选人中证据链最完整的——技术背景、意识形态、地理位置、年龄、用词习惯,大部分都能对上。但这不是证明,只是高度吻合。

真正解开谜团的钥匙只有一把:移动那 100 万枚 BTC 中的任意一枚。

在那之前,这仍然是一个概率问题,而不是事实。