全国科技工作者日 | 仰望星空的“AI巨脑”：中国科研者在路上-新闻中心-科技有限公司

全国科技工作者日 | 仰望星空的“AI巨脑”：中国科研者在路上

发布时间：2025-05-30 12:00:02

阅读量：397次

【导语】在智能助手和AI生成技术日益普及的今天，大语言模型作为人工智能领域的最前沿技术之一，正深刻改变着我们的生活。从ChatGPT到文心一言，这些“超级语言大脑”背后，凝聚着成千上万名中国科研工作者的智慧与汗水。他们在算力受限、生态不完整的条件下，从零开始，自主研发出属于中国自己的AI语言大脑。本文将带您深入了解大语言模型的炼成之路、国产大模型的破局挑战、动人的科研者故事，以及AI如何融入中国语言和文化。在第九个“全国科技工作者日”之际，让我们向这些默默奉献的科技工作者致敬。

“你好，我是你的智能助手，请问有什么可以帮您？”

也许你早已习惯了和智能手机、客服机器人“对话”的场景；也许你用过ChatGPT、文心一言这样的AI生成文字、翻译、写代码。它们背后的核心技术，叫做大语言模型。这是当今人工智能最前沿的代表之一——能读、能写、能答题，甚至能“讲故事”，像一个永不疲倦的智慧图书馆。

图片来源：百度文心一言首页

而你或许不知道，在它们顺畅回应你的那一刻，藏着成千上万名中(zhōng)国(guó)科(kē)研(yán)工(gōng)作(zuò)者(zhě)夜(yè)以(yǐ)继(jì)日(rì)的(de)努(nǔ)力(lì)。他(tā)们(men)在没有顶级算力、没有完整生态的条件下，从零构建出属于中国自己的“AI语言大脑”，用技术和汗水书写下这个时代的科技答卷。

1、超级“语言大脑”是如何炼成的？

所谓“大语言模型”，指的是一种通过学习大量文本数据，从而具备语言理解与生成能力的人工智能系统。它不是真正“懂”语言，而是通过庞大的参数和复杂的训练机制，让机器学会了“预测下一个词”。这个过程，需要成百上千亿级的模型参数、千万本书的总信息量、数周甚至数月的训练时间。

比如ChatGPT，背后是OpenAI花费数亿美元、使用几千张高端GPU显卡和超大语料训练出的成果。而在中国，自主研发出拥有数百亿甚至千亿参数的语言模型，是科研者面对的一场“硬仗”。

2、国产大模型，破局之路走得很难

研发大语言模型，最难的不是“写代码”，而是“通盘突破”：

01语料难

中文的语言结构更复杂、歧义性更强，公开高质量中文语料少。科研者不得不从网页、书籍、论文、论坛中手动清洗出语料，还要过滤“低质文本”和(hé)“敏(mǐn)感(gǎn)内(nèi)容(róng)”。一个模型的训练语料，往往需要上百人投入数月筛选(xuǎn)处(chù)理(lǐ)。

02算(suàn)力(lì)紧(jǐn)

大(dà)模(mó)型(xíng)训(xun)练(liàn)是(shì)资(zī)源(yuán)密(mì)集型(xíng)工(gōng)程(chéng)。以(yǐ)千(qiān)亿(yì)参(cān)数(shù)模(mó)型(xíng)为(wèi)例(lì)，动(dòng)辄(zhé)需(xū)要(yào)数千张GPU服务器支持，而在芯片领域，我国受制于供应链“卡脖子”。于是科研者用“模型压缩”“并行调度”等方式做减法，用最少的资源跑出最好的效果。

03对标高

ChatGPT带来的震撼让世界意识到：谁掌握了大模型，谁就能在人工智能时代的中占据重要地位。中国必须有自己的AI底座，自己的语言理解系统。为此，“悟(wù)道(dào)”“ChatGLM”“文心一言”“天书”“百川”“DeepSeek”等国产大模型接连问世。

根据国家互联网信息办公室最新披露的数据显示，截至2025年4月，已成功通过备案的人工智能大模型数量达到了346家——从通用模型，到金融、医疗、教育等行业专用模型，这背后，是无数科研团队昼夜鏖战的成果。

3、那些让人动容的科研者故事

2023年，天数智芯的天垓100国产GPU加速卡迎来了一场硬仗——为北京智源研究院训练70亿参数的Aquila语言模型提供算力支持。面对国产GPU与国际顶尖产品的性能差距，天数智芯产品线总裁邹翾带领团队展开了一场技术攻坚战。他们日夜兼(jiān)程(chéng)，重(zhòng)构(gòu)IXCCL通(tōng)信(xìn)库(kù)，优(yōu)化(huà)混(hùn)合(hé)精(jīng)度(dù)训(xun)练(liàn)方(fāng)案(àn)，硬(yìng)是(shì)将(jiāng)多(duō)卡(kǎ)通(tōng)信(xìn)效(xiào)率(lǜ)提(tí)升(shēng)至(zhì)98%，最(zuì)终(zhōng)实(shí)现(xiàn)了(le)连(lián)续(xù)19天(tiān)的(de)稳(wěn)定(dìng)训(xun)练(liàn)。当(dāng)Aquila语(yǔ)言(yán)模(mó)型(xíng)如(rú)期(qī)完(wán)成(chéng)训(xun)练(liàn)并(bìng)达(dá)到(dào)预(yù)期(qī)效(xiào)果(guǒ)时(shí)，这(zhè)支(zhī)团(tuán)队(duì)用(yòng)行(xíng)动(dòng)证(zhèng)明(míng)：在(zài)算力自主化的道路上，中国人的创新精神永远不会被硬件条件所限制。

图源：pexels

在高校、研究所、企业、实验室，从“算法调优”到“数据治理”，从“推理优化”到“模型压缩”，每一个细节都凝聚着无数人沉默却坚定的努力。他们或许不在镜头前，不在热门话题里，却正是AI革命的无名英雄。

4、把AI写进中国语言和文化

“我们希望让AI用中文思考。”这是很多国产大模型团队的共同目标。

不仅仅是翻译得通顺，更要理解中国语言的语境，理解我们的典故、成语、对联、诗词，甚至是“一个眼神”的情感含义。科研者正在将这些“文化基因”注入AI中。

有人用模型进行古文翻译，有人训练AI生成中医问诊语言，还有人尝试用AI保护濒危方(fāng)言(yán)。AI不(bù)是(shì)替(tì)代(dài)人(rén)类(lèi)，而是服务社会、传承文明的新工具。大语言模型正逐渐从科研实验室走进医疗、教育、司法、工业、文旅等多个领域，为人类解决实际问题，也为中国讲好自己的故事提供了新的载体。

5、写在“全国科技工作者

2025年5月30日，是第九个“全国科技工作者日”。我们将目光投向那些或许无名却做着意义非凡的事情的科技工作者，他们在国产AI道路上，仰望星空，脚踏实地。

在大模型这场没有硝烟的科技竞赛中，他们不仅是工程师，更是文化守望者，是时代的记录者。他们用代码构筑语言的秩序，用数据打造理解的基石，用算法塑造思维的逻辑。

他们是这个时代最可敬的人之一。

致敬中国每一位科技工作者，向你们说一声：节日快乐，未来可期。

供稿单位：重庆理工大学计算机科学与工程学院

作者：重庆理工大学张佳雯

审核专家：倪伟

声明：除原创内容及特别说明之外，部分图片来源网络，非商业用途，仅作为科普传播素材，版权归原作者所有，若有侵权，请联系删除。