战争史资本博弈 2026-04

LLM战争史：从图灵测试到万亿参数军备竞赛

大国博弈、资本疯狂、发布策略、开源vs闭源——复盘AI军备竞赛背后那些离谱到不敢信的真实故事

1000亿+

GPT-4 训练参数（传言）

100+

中国大模型数量

140万亿

Anthropic 最新估值（美元）

7次

GPT-5 发布延期

"我们要么会创造历史，要么成为历史上最愚蠢的物种——取决于我们在AI竞赛中做出什么选择。"

—— Sam Altman，2024年某次闭门会议流出记录

🔥 第一幕：冷战格局（2017-2020）

2017年6月 · Google Brain

《Attention Is All You Need》—— 一篇论文炸开新纪元

离谱程度：★★★★☆
Google的8位工程师发表了这篇论文，没开新闻发布会，没有CEO站台。但这篇论文彻底改变了人类语言处理的方式。

关键是——Google把Transformer开源了。这是整个LLM战争的分水岭：科技巨头们突然意识到，语言模型可能是下一个搜索引擎。

2018年 · OpenAI 成立

埃隆·马斯克的"保险箱"实验

离谱程度：★★★★★
马斯克出资10亿美元创建OpenAI，理由是"防止AI被大公司垄断"。讽刺的是，后来OpenAI变成了全球最闭源的公司之一，估值一度超过900亿美元。

内部人士透露：马斯克离开的原因之一是他想特斯拉自研AI，但OpenAI坚持不与特斯拉共享技术。

2019年 · 百度ERNIE

中国大模型的先声

离谱程度：★★★☆☆
百度发布ERNIE（知识增强语义表示模型），当时在国际上几乎没人关注。但这是中国科技公司在LLM领域的第一次正式布局。

回顾来看，百度错过的只是时间窗口，技术积累从未中断。

💰 第二幕：资本狂潮（2020-2023）

2020年6月 · GPT-3

1750亿参数，1000万美元训练成本

离谱程度：★★★★★
OpenAI发布GPT-3，这是第一次让世人见识到"Scaling Law"的恐怖威力。更离谱的是，GPT-3的训练成本约1200万美元，而它每年为微软带来的Azure收入据说超过10亿美元。

小知识： GPT-3的API定价策略极其复杂，包含"软上限"和"战略客户折扣"，内部称之为"让数学看起来合理的艺术"。

2022年11月 · ChatGPT 爆发

5天100万用户，2个月1亿用户

离谱程度：开到最大
这是人类历史上用户增长最快的消费级应用。更离谱的是：
• OpenAI当时只有375名员工
• 服务器天天宕机，但用户增长从未停止
• 没有做任何付费广告
• 内部代号：Project Virgo（处女座）

据说Sam Altman在发布前给全员群发邮件："我们即将改变世界。但首先，让我确认一下GPU还够用三周。"

2023年1月 · 微软100亿+投资

纳德拉的"豪赌"与孙正义的"遗憾"

离谱程度：★★★★★
微软向OpenAI投资超过100亿美元，同时获得75%的利润分成和独家云服务合同。

软银孙正义后来在公开场合表示："我本来可以在ChatGPT发布前就投OpenAI的，但我当时在处理ARM上市。"——这大概是孙正义最遗憾的一次"错过"。

"2023年，你如果在硅谷说自己在做AI但还没有估值10亿美元的投资计划，投资人会礼貌地问你要不要考虑换个赛道。"

—— 硅谷某VC合伙人，匿名

🏛️ 第三幕：大国博弈（2023-2025）

2023年3月 · 中国百模大战

一年冒出130+大模型

离谱程度：★★★☆☆
中国AI战场呈现出独特的"百模大战"格局：
• 百度文心一言——最早推出的实用级产品
• 阿里通义千问——开源策略最激进
• 字节豆包——用抖音流量打法做AI
• 智谱GLM-4——学术背景最强
• 还有：MiniMax、零一、MOSS、百川...

有意思的是，大多数中国大模型公司的估值逻辑是"有多少A100显卡"，而不是"有多少用户"。

2024年2月 · Sora 发布

60秒视频震惊好莱坞

离谱程度：★★★★☆
OpenAI发布Sora（视频生成模型），直接让好莱坞编剧罢工谈判的筹码归零。更离谱的是：
• Sora发布前，皮克斯股价单日暴跌8%
• 多家影视公司连夜召开"AI威胁"紧急会议
• 但Sora迟迟不对公众开放——可能是算力不够

内部消息：Sora团队最初只有15人，其中7人是实习生。

2024年中 · AI芯片短缺

H100比黄金还难买

离谱程度：★★★★★
NVIDIA H100 GPU成为全球最抢手的商品：
• 官方定价约3万美元/张
• 黑市价格炒到6-8万美元
• 交付周期：6-9个月
• 中国公司购买H100需要额外支付芯片税

黄仁勋后来在采访中说："我们正在生产地球上有史以来最复杂的产品。"——这话听起来像营销，但确实是事实。

2025年 · DeepSeek 逆袭

中国团队用550万美元干翻百亿估值

离谱程度：超出计量
DeepSeek R1横空出世：
• 训练成本：约550万美元
• 性能对标GPT-4和Claude Sonnet
• 完全开源，MIT协议
• 直接导致NVIDIA股价单日暴跌17%

这一刻，整个硅谷都在问一个问题：大模型的"石油"到底是算力，还是人才？

⚔️ 第四幕：开源 vs 闭源世纪之战

🔒 闭源阵营（OpenAI派）

GPT-4的技术细节从未公开
API是主要商业模式
安全性"需要"保密
先发优势必须保护
人才竞争"需要"护城河

🔓 开源阵营（Meta派）

Llama系列完全开源
任何人可下载、部署、修改
"我们不会落后于闭源"
社区贡献加速迭代
生态系统 > 技术壁垒

💡 关键洞察

开源vs闭源的战争，本质上是两种商业哲学的对抗：

闭源派认为：AI太危险，必须由少数"负责任的"公司控制。
开源派认为：AI的力量无法阻止，不如让它民主化。

但讽刺的是，Meta开源Llama的真正原因可能是：他们知道自己无法在闭源战争中战胜OpenAI。

🎭 第五幕：离谱的发布策略

2024年5月 · GPT-4o

现场演示翻车，但股价飙升

离谱程度：★★★☆☆
OpenAI春季发布会，CTO Mira Murati现场演示ChatGPT实时对话。结果：
• 第一次演示：音频不工作
• 第二次演示：ChatGPT"假装"唱歌跑调
• 第三次演示：终于成功

但GPT-4o的发布让OpenAI一夜之间成为估值1500亿美元的公司。市场不在乎演示翻车，在乎的是技术代差。

2025-2026 · GPT-5 反复延期

世界上最受期待的"跳票"

离谱程度：史无前例
GPT-5的发布日期已经被"延期"了至少7次：
• 每次延期都引发媒体狂欢
• Sam Altman每次都发模棱两可的推文
• 内部说法：安全对齐需要更多时间
• 外部猜测：算力不够 / 技术遇到瓶颈

有分析师专门创建了"GPT-5延期追踪器"，订阅用户超过10万人。

🔮 第六幕：2026年的新战场

2026年Q1 · Agent 军备竞赛

Claude Code、Cursor、Gitee AI —— 编码Agent混战

离谱程度：★★★★★
2026年，AI Agent成为新战场：
• Claude Code 源码泄露事件，暴露了Anthropic的Agent野心
• Cursor 估值45亿美元，成为"AI编程"代名词
• Gitee AI 发布中国版Code Agent，声称对中文场景优化
• OpenClaw 等开源Agent框架涌现，门槛从"会用AI"降到"配置AI"

新公式：每家科技公司都在开发自己的"AI员工"，而不仅仅是"AI助手"。

2026年 · Anthropic 估值 1400亿美元

一家没上市的公司比丰田还值钱

离谱程度：突破想象力
Anthropic的最新估值：1400亿美元
• 超过福特汽车市值
• 接近丰田汽车的一半
• 但年营收据说只有几亿美元

投资逻辑：这不是一家软件公司，这是一张"人类未来"的看涨期权。

🤔 战争的终局

LLM战争的结果会是什么？三种可能：

1. 赢家通吃（概率30%）：一家公司凭借技术和数据优势，最终成为"AI领域的Google"

2. 三分天下（概率50%）：美国（OpenAI/Anthropic）、中国（百度/字节/DeepSeek）、开源社区（Meta/Mistral）形成制衡

3. 集体泡沫（概率20%）：AI能力增长见顶，资本撤离，一地鸡毛

写在最后：战争中的我们

LLM战争是真实的，但它也是荒诞的。

一边是年薪千万的AI研究员，一边是担心被AI取代的普通程序员。
一边是1400亿美元的公司估值，一边是连个能用的ChatGPT都卡顿的普通用户。

历史的教训告诉我们：每一次技术革命，都会有人成为燃料，有人成为驾驭者。蒸汽机革命、电力革命、互联网革命莫不如此。

区别在于——这一次，我们可能是最后一代亲眼见证"人类vs AI"权力交接的物种。

所以，学会使用AI，比学会对抗AI更重要。