深度地理

为什么中国所取得人工智能突破并不令人意外?

中国对技术的乐观态度推动了其在技术领域的崛起。 Image: REUTERS/Florence Lo/File Photo

Kaiser Kuo
Writer, World Economic Forum, and host of the Sinica Podcast
本文章是 新领军者年会 的一部分
  • 从DeepSeek到MiniMax,中国在生成式人工智能方面的最新突破是多年来的国家战略、公私合作以及投资人才和基础设施的成果。
  • 尽管美国对先进芯片实施出口管制,中国的人工智能公司依然通过架构创新、效率提升和开源合作适应了情况,这标志着从依赖向韧性与自主的转变。
  • 中国的技术乐观主义文化、协调有序的体制和监管的完善程度,使人工智能得以以前所未有的速度实现规模化发展。

过去一年,中国的生成式人工智能领域出现了一系列引人注目的发展。

DeepSeekR1和V3等开源模型在性能指标上与美国同行不相上下,并且在某些情况下超越了后者——尽管受到美国出口管制的限制。其他模型也表现不俗,包括阿里巴巴的Qwen3,该模型在推理和语言任务上排名全球前列。还有更新的MiniMax M1,仅使用512块英伟达H800 GPU进行训练,也成功与领先的西方模型展开竞争。

这些突破令美国科技和政策界感到震惊,掀起了类似“斯普特尼克时刻”的反应。

然而,这种震惊本身就令人惊讶。若能更清醒地评估中国在全球人工智能生态系统中的结构性地位——包括其大规模的STEM教育、高密度的计算基础设施、成熟的应用研究基础,以及其治理体系在投资、政策和人才方面的协调能力——就会发现,这一水平的表现其实是可预期的。

我个人的看法很大程度上源于我在中国科技行业的多年经验。其中包括我在百度工作的时期,正值人工智能热潮初起;从2013年到2016年,我曾与机器学习先驱吴恩达紧密合作,也见证了百度联合创始人兼CEO李彦宏在个人和组织层面上对将人工智能置于公司未来核心的承诺。此后数年,通过与研究人员、企业家和政策制定者的对话(这些对话我也在播客Sinica Podcast中分享),我不断重新得出并加深了这一理解。

这些发展并非凭空出现,以下是促成如此快速进步的一些关键因素。

中国如何悄然构建世界级人工智能生态系统

DeepSeek和Qwen在2024年底至2025年初令西方观察者感到震惊,但其实中国生成式人工智能的崛起早在近十年前就已打下基础。2017年,国务院发布《新一代人工智能发展规划》,将人工智能确立为国家战略重点。随后,各省市相继出台配套实施方案,国家支持的风险投资工具提供了充足的资金支持,而监管沙盒机制则为AI初创公司提供了广阔的操作空间。

中国企业积极响应。到2022年,中国在人工智能相关专利申请数量上已是美国的四倍,顶级研究成果的差距也在不断缩小。到2024年,得益于专家混合、多头潜在注意力等架构创新,DeepSeek-V3等模型已在常见语言与推理基准测试中超越了MetaLlama 3.1AnthropicClaude 3.5 Sonnet

MiniMax等新参与者的涌现体现了中国本土人工智能生态系统的快速成熟。与此同时,百度、腾讯、智谱AI等现有参与者也持续迭代自身的大语言模型,不断提升模型能力、任务通用性和大规模部署水平。

一种普遍的叙事认为,如果缺少先进芯片、外资支持或开放的研究生态系统,中国的人工智能产业将陷入停滞。当美国对中国半导体行业关键领域实施严格出口管制,甚至禁止美国人员参与相关工作时,许多人预测中国高科技产业将遭受毁灭性打击。

但体制与产业能力的稳步积累讲述了一个不同的故事。正如许多人评估的,中国并非一夜之间实现飞跃,而是通过多年的政策治理和广泛的公私协同稳步发展。中国培育出了一个对人工智能不是持怀疑态度,而是充满热情的社会。

以创新应对出口管制

在过去五年里,美国一直试图实施出口管制,尤其是在面向中国出口方面,以保护美国自身在人工智能领域的领先地位。这些举措始于将华为等企业列入美国商务部实体清单,并在2022年10月升级,严格限制出口先进AI芯片(如英伟达的A100和H100)以及半导体制造工具。即便是像英伟达H800和A800这样的定制化低性能版本,也最终在2023年10月被禁止出口。

虽然这些管控短期内大幅扩大了中美AI企业在算力方面的差距,但也激发了中国AI行业一轮即兴创作和效率创新的浪潮。例如,DeepSeek于2025年1月发布其R1模型,震惊了全球观察者。该公司表示,该模型仅用约2,000块英伟达H800 GPU、耗资560万美元就完成了训练,而同期西方同类模型所需的算力和资金则高出许多。

包括打造DeepSeek的High-Flyer AI在内的多家中国企业,在出口限制生效前便预先囤积了数万枚A100芯片。据报道,还有企业通过东南亚中间商获取GPU。尽管有这些物流上的权宜之计,但更长期的应对措施是结构性的:对国产芯片设计的投资持续增长,以华为昇腾系列为代表;对国产半导体制造的投入也在加大。中芯国际(SMIC)据称已能使用深紫外(DUV)光刻技术生产芯片,以替代受美国出口管制限制、由荷兰ASML公司垄断的更先进的极紫外(EUV)技术。

与此同时,架构层面的创新也变得尤为紧迫。面对算力的严苛限制,中国的模型开发者开始积极提升效率,致力于在不牺牲性能的前提下降低训练成本。DeepSeek采用稀疏的专家混合模型和内存高效的推理流程,正是这一趋势的成果之一。该公司积极采用开源发布策略,包括在宽松许可下发布模型,这似乎增强了国内外的合作。多位我曾交流过的中国业内观察人士表示,DeepSeek的成功也进一步强化了国家对开源开发的支持热情,认为这是降低平台依赖和地缘政治风险的一种防范措施。

出口管制的实际效果是强化了中国人工智能工程师、创业者和投资者“以少做多”的动力,优化每瓦功耗、每美元投入、每块GPU的性能表现。这些限制并未阻碍中国AI发展的势头,反而促使其变得更具韧性和自主性。

中国在技术推广方面的优势

中国人工智能实力的一个关键却常被低估的维度,并不仅仅体现在“前沿创新”上,更在于其将大型语言模型等通用技术迅速而广泛地推广到工业、政府和消费领域的能力。麻省理工学院的黄亚生在其著作《东方的兴衰》中深入探讨了中国的规模化能力。Jeffrey Ding等学者则有力地区分了“前沿创新”和“技术扩散”。他指出,在变革性技术领域,一个国家的实力更多体现在其将技术大规模嵌入经济体系的制度能力,而不仅是最初的发明。Ding的结论是,中国在这方面其实相对较弱。但他的衡量方式相对狭窄,他统计的是一个国家中在三大顶级AI会议中至少发表过一篇论文的机构数量。我认为,尽管这一点是对的,但在技术推广方面,中国依然拥有决定性的结构性优势。

中国在移动支付、高速铁路和工业机器人等其他关键技术方面拥有快速部署的记录,已经建立了一套将新兴技术转化为广泛基础设施的标准流程。如今,这一模式也正应用于生成式人工智能。无论是客服机器人、文件翻译引擎、AI辅助的医疗分诊,还是教育辅导应用,大语言模型如今已在中国本土市场实现规模化部署。数以百计的模型已提交监管审查,该流程现已通过中国的生成式AI算法备案数据库实现公开可追踪

在深圳等城市,软件、硬件与供应链的高度融合形成了紧密集成的生态系统,使得快速原型设计和实时迭代成为可能,这种模式在其他地区难以复制。模型的开发并不与部署相分离,研究与应用在空间上和体制上实现了融合。模型开发者与具体行业的应用方(无论是工业设计、物流,还是消费电子领域)之间的紧密联系,加速了反馈循环,缩短了从概念验证到市场落地的时间。

这种规模化能力不仅仅是由需求推动的。它反映出一种贯穿中国科技行业的组织逻辑。阿里巴巴、腾讯和字节跳动等公司在一个竞争激烈的环境中成长,成功的工具可以以极小的阻力推向数亿用户。即使是知名度较低的大语言模型开发者,也能在其他国家难以想象的规模上进行测试。

此外,中国庞大的语言特定数据集(来自社交媒体、电商平台、国家媒体以及学术语料库)为训练在中文任务中表现出色、并逐步扩展至双语或多语种任务的模型提供了独特优势。这种语言规模,加上制度协调能力和广阔的市场覆盖,使得人工智能模型的推广不仅仅是技术层面的操作,更是一项系统性的国家能力。

《星际迷航》vs《黑镜》

如果说体制协调、基础设施和人才构成了中国人工智能能力的“骨架”,那么其对技术的文化取向则提供了大部分“肌肉”。一种普遍存在且在社会中不断被强化的信念,即技术有助于推动个人与国家进步,依然是中国最重要但常常被忽视的优势之一。

在美国和欧洲,关于监管的讨论常常聚焦于对监控资本主义、AI驱动的虚假信息传播以及生存风险的担忧。与欧美广泛存在的技术焦虑相比,中国社会在很大程度上仍处于可以称作“星际迷航”的阶段,即一种技术乐观主义的取向,在这种取向中,人们普遍认为创新与提升物质水平、增强国家能力和促进民族复兴相联系。正如我在其他地方所论述的,这与西方日益盛行的“黑镜”思维形成鲜明对照。

这种对比不应被误解。诚然,毫无节制的技术乐观主义可能是鲁莽的,特别是在强大模型尚未得到充分保障的情况下就大规模部署。但就中国而言,乐观并不意味着缺乏监管。正如Kendra Schaefer在最近的一次采访中指出的,中国的人工智能监管体系在许多方面实际上领先于欧盟和美国。由中国国家互联网信息办公室(CAC)维护的生成式AI算法备案数据库,现已收录数百个公开列示的大语言模型,其透明度目前在西方任何监管体系中都尚无可比。该备案流程要求披露模型架构、训练数据来源和安全机制,并辅以关于模型对齐和内容控制的技术指导。

不过,这种对监管监督的接受并未削弱中国对技术发展的热情。在中国,工程师、计算机科学家和人工智能研究人员在公众中的地位仍然很高。技术人员的成功并不会引起猜疑或不安,反而被视为国家活力的体现。无论是初创公司还是国有企业,都将人工智能成果作为中国实现长期现代化战略的重要组成部分来宣传。孩子们从更小的时候就开始学习编程,地方政府开展AI素养宣传活动,大语言模型驱动的应用在电商、医疗和物流等领域迅速普及。

简而言之,中国的技术乐观主义并不幼稚。它与国家日益增强的引导和指引AI发展的能力并行不悖。但这种根植于文化的取向,即相信更智能的机器会带来更美好的生活,持续影响着人才的招募方式、模型的使用方式以及公众对创新的接受方式。

战略协同:国家、市场与学术界齐心协力

中国在生成式AI领域快速进展的一个不太显眼却影响深远的驱动因素,是其公共部门机构、学术研究机构与私营企业之间的紧密协作。这种协作在中国以外有时会被持怀疑态度地看待,尤其当它被描述为国家主导的产业政策或国家支持的企业时。但在实践中,它的实际效果是:降低了科研与应用之间的壁垒,加速了资金决策,并统一了不同领域的长期技术发展目标。

例如,清华大学、北京大学、上海交通大学、浙江大学等中国最具实力的研究型高校不仅是培养人工智能人才的基地,还是商业创投的知识孵化器。中国许多领先的生成式AI公司,如智谱AI和百川智能,便直接源自高校研究实验室,往往获得国家附属投资机构的种子资金,并与地方开发区或数字经济产业集群建立起内嵌式合作关系。

国家引导基金,尤其是与2010年代后期启动的“新基建”战略相配套的资金,重点支持算力基础设施、AI芯片和云服务。这些基金为一些在私人市场中可能难以获得同等支持的项目提供了长期资本,特别是在经济收紧时期或投资回报存在不确定性的情况下。但与此同时,市场刺激依然存在。中国领先的AI初创公司面临着来自如DeepSeek、MiniMax、月之暗面和科大讯飞等对手的激烈本土竞争。这些企业都处在一个节奏迅速的环境中,在这里,持续迭代和快速落地的能力才是生存与发展的关键。

这种协同效应在如DeepSeek和阿里巴巴等公司采取的开源战略中表现得尤为明显。DeepSeek决定将R1等模型以宽松的MIT许可协议开源,不仅提升了其在国际上的可见度,也推动了一波下游的创新和改进浪潮,在中国的AI开发者社区中引发广泛响应。多位观察人士指出,这种做法引起了中国政策制定者的积极关注。政策层越来越将开源模型视为对抗西方平台主导地位的战略平衡工具——也是一种在不依赖美国云服务商或模型API的前提下,实现中国自研框架国际化的有效路径。

学术界与产业界的紧密联系进一步强化了这种协同。许多在NeurIPS、ACL等顶级会议上发表的研究论文,往往由来自企业实验室的研究人员与高校学者共同署名。在监管方面,尽管中国的模型治理体系具有自上而下的结构特点,但也允许私营部门广泛参与内容规范、界面设计与使用监控等方面的完善。最终形成了一条从基础研究到消费级产品的快速管线,其垂直整合程度更高,资金支持也往往比那些碎片化的创新生态系统更为充足。

当然,这种协同也并非没有代价。它可能导致思维趋同,在某些领域也确实对表达和试验设置了严格边界。但在生成式人工智能这一技术与经济领域中,中国这种高度一致性的推进方式,使其能够以前所未有的速度将技术突破转化为面向社会的大规模工具。

中国生成式人工智能崛起的必然性

这一切不该令人感到意外。

中国在生成式人工智能领域的迅速崛起,并非地缘政治上的意外转折,而是多年前一系列决策的合乎逻辑的结果:优先发展技术领域的教育,投资高算力基础设施,大规模动员人才,将国家战略与学术研究及私营创新相协调,并推动一种虽然有别于西方规范、但极具主动性和适应性的监管环境。虽然新闻头条聚焦于芯片禁令和出口管制,但真正奠定基础的,是规模化、协调性、乐观主义和坚定承诺,这些因素远更重要。

那些将中国的前景归结为能否获得英伟达GPU的人,忽略了更宏大的图景。他们未能看到中国对新兴技术采取的全社会协同方式——不仅具备发明能力,更具备推广和规模化的能力——使中国能够以惊人的速度缩小差距。他们低估了中国在AI监管上的成熟度,如算法备案制度和内容监管机制,已在多个方面领先于欧盟。他们误判了中国的文化氛围——在这里,技术人员仍普遍受到真诚尊重,而非被怀疑为动机可疑的“科技男”;在这里,“机器让世界变得更好”这一理念尚未被犬儒主义腐蚀。

随着生成式人工智能的持续演进,全球讨论若能少一些“震惊”的叙事,多一些对推动进步的体系——无论是教育、产业、意识形态,乃至文化层面的——的深入关注,将大有裨益。中国的模式并非完美,但其在人工智能领域的崛起不仅体现了其韧性,更重要的或许是反映了一种战略布局。

本文作者:

Kaiser Kuo,世界经济论坛撰稿人、Sinica Podcast播客主持人

本文原载于世界经济论坛Agenda博客,转载请注明来源并附上本文链接。

编辑:王灿

不要错过关于此主题的更新

创建一个免费账户,在您的个性化内容合集中查看我们的最新出版物和分析。

免费注册

许可和重新发布

世界经济论坛的文章可依照知识共享 署名-非商业性-非衍生品 4.0 国际公共许可协议 , 并根据我们的使用条款重新发布。

世界经济论坛是一个独立且中立的平台,以上内容仅代表作者个人观点。

实时追踪:

中国

分享:
全局信息
探索和追踪解决之道 中国 正在影响经济、产业和全球问题
World Economic Forum logo

每周 议程

每周为您呈现推动全球议程的紧要问题(英文)

立即订阅

更多关于 深度地理
查看全部

Europe in the Intelligent Age: From Ideas to Action

关于我们

  • 我们的任务
  • 我们的历史
  • 领导团队
  • 影响力

加入我们

快捷链接

语言版本

隐私政策和服务条款

站点地图

© 2025 世界经济论坛