科学发现的规模法则：自主通用科学家将突破科学极限-新闻中心-科技有限公司

科学发现的规模法则：自主通用科学家将突破科学极限

发布时间：2025-08-07 18:00:30

阅读量：329次

【导语】在人类知识爆炸式增长的今天，科学智能与AI科学家的崛起正悄然改变科研范式。顶尖研究机构的研究者们在论文《Scaling Laws in Scientific Discovery with AI and Robot Scientists》中提出了“自主通用科学家”（AGS）的概念，预示着科学发现的新纪元。AGS系统有望打破学科界限，自动化科研生命周期，从数据挖掘到假说提出，再到实验设计与论文撰写，全面革新科学探索的方式。这一变革不仅预示着科学发现“规模法则”的重写，更将开启科学研究的“摩尔定律”时代，引领人类文明探索未知的新篇章。

作者：于春景

人类知识正以前所未有的速度爆炸，科学智能、尤其是AI科学家的发展正在迅速改变人类科研范式和版图。在这场科学研究革命的前夜，一群来自多伦多大学、清华大学、佐治亚理工学院等顶尖机构的研究者们，发表了一篇富有远见的论文《Scaling Laws in Scientific Discovery with AI and Robot Scientists》，指出一个由人工智能（AI）和具身机器人（Embodied robotics）驱动的“自主通用科学家”（Autonomous Generalist Scientist，AGS），将有望打破科学的学科界限，自动化整个科研生命周期，从文献海洋中披沙拣金，到大胆提出假说，再到设计并执行复杂的虚拟与物理实验，乃至最终撰写具有颠覆性成果的学术论文。

Scaling Laws in Scientific Discovery with AI and Robot Scientists, https://arxiv.org/abs/2503.22444

这预示着，科学发现的“规模法则”（Scaling Laws）本身，或许将因这些不知疲倦、能力超群的AI自主系统的加入而被彻底改写。

一、科学研究的演变：从人类到自主系统

人类文明史上，科技发展一直是推动社会进步的核心力量，深化我们对自然世界的理解，推动技术创新，解决复杂问题，改善社会福祉。然而，传统研究方法存在固有的复杂性和方法学局限性，常常阻碍科学快速进步。

例如，一位科学家穷其一生可能也只能深入钻研某些细分领域。而解决当今世界如气候变化、疾病防治等复杂问题(tí)，往(wǎng)往(wǎng)需要跨越多个学科的知识融合。另一方面，基于大语言模型的AI科学家则在海量数据上训练，掌握了跨学科生成和理解文本、多模态信息的能力，在信息综合、思想产生、编码乃至学术写作等方面已展现出超越人类的惊人潜力。

尽管如此，当前人工智能在科学研究中的应用主要集中于数据分析、模型构建、文献综述等虚拟空间的任务。在诸如药物设计、化合物筛选等领域，AI已经成为强有力的辅助工具。然而，科学研究的全流程不仅包括理论推演和数据处理，还涉及实验设计、设备操作、样本处理等物理世界的复杂环节。如何让AI系统进一步参与到这些实际操作中，成为推动科学创新的新课题。为此，本文研究团队提出了“自主通用科学家”（AGS）的设想。AGS旨在打造一个能够跨学科自主管理科学研究全过程、兼具虚拟与物理操作能力的系统，提出了科学研究演进的三个阶段：

1.人类科学家阶段（Human）：完全依靠人类研究者进行科学发现；

2.AI与机器人协作阶段（Co-scientists）：人类与AI、机器人共同开展研究；

3.自主通用科学家阶段（AGS）：智能系统完全自主地进行科学研究。

图1 展示科学发现的规模法则，即科研规模越大，产出的科学知识越多，在不同阶段，两者之间有不同的增长规律。横轴表示科学家数量或科研时间（代表规模），纵轴表示科学知识总量（代表产出）。

这种演变不仅仅是研究方式的改变，更是一场真正的范式转移，AGS可能催生科学发现的新规模法则 (New Scaling Laws)。传统上，科学知识的增长在一定程度上与投入的人力（科学家数量）和时间相关，AI作为合作科学家（Co-scientists）的出现，已经开始提升这一增长曲线的斜率。而AGS，凭借其自主性、通用性和潜在的并行工作能力，有望将科学发现的效率提升到前所未有的水平，甚至可能呈现指数级显著陡峭的曲线增长态势，如图1所示。就像计算机如何彻底改变了数学和计算问题的解决方式，自主科学(xué)家(jiā)系(xì)统可能会重新定义我们发现和理解世界的方式。

研究者在讨论AGS系统的潜力时指出：“具身机器人对极端环境的适应性，以及科学知识积累的飞轮效应，将持续突破物理和(hé)知(zhī)识(shi)的(de)边(biān)界”，如图2所示。

图2 科学知识积累的飞轮效应与科学发现的边界

根据论文，AGS系统可能通过以下几个关键机制，自我强化的知识加速积累，改变科学发现的扩展规律：

1.全周期自主运行能力：AGS能够在没有人类干预的情况下管理整个研究周期，从文献分析到实验执行再到结果解释，同时能够在计算环境和物理实验室之间无缝切换，将理论(lùn)建(jiàn)模(mó)直(zhí)接(jiē)转(zhuǎn)化(huà)为(wèi)精(jīng)确(què)的(de)实(shí)验(yàn)操(cāo)作(zuò)。

2.跨(kuà)学(xué)科(kē)知(zhī)识(shi)整(zhěng)合(hé)：能够融合多个领域的专业知识，突破传统学科边界，发现跨领域的创新机会和意外联系，实现系统性的知识重组和交叉创新。

3.持续学习与快速迭代：通过内部反思机制、外部反馈循环和海量数据学习，不断优化研究方法和能力，实现“快速失败、快速学习”的高效研究模式和螺旋式能力提升。

4.规模化协同与知识网络效应：多个AGS可以大规模并行处理、全天候不间断运行，同时所有AGS产生的知识、经验和方法论能够被整个网络瞬间共享和复用，形成集体智慧的正反馈循环。

在图3显示了世界银行历史数据的趋势，并预测了未来随着AI和机器人科学家加入研究队伍，科学出版物数量将会出现显著不同的增长模式，即从人类主导到AGS主导的科学研究中，知识生成率的变化趋势，将会超过显著超过现有人类科研增长水平。

图3 全球科研产出和人力投入的历史模式与预测发展。上半部分显示了人类研究者产生的出版物数量（蓝色细线为历史数据，绿色柱状为预测，其中包含AGS辅助和(hé)完(wán)全AGS的(de)贡(gòng)献(xiàn)，虚(xū)线(xiàn)为(wèi)出(chū)版(bǎn)物(wù)趋(qū)势(shì)）。下(xià)半(bàn)部(bù)分(fēn)显(xiǎn)示(shì)了(le)研(yán)发(fā)人(rén)员(yuán)数(shù)量(liàng)（每(měi)百(bǎi)万(wàn)人(rén)中(zhōng)的(de)数(shù)量(liàng)，橙(chéng)色细线为历史数据，紫色柱状为预测，其中包含人类、人机协作和AGS的贡献，虚线为研究人员趋势）。数据显示，尽管研发人员数量在增加，出版物数量也在相应增长，但随着AI科学家和机器人科学家的引入，预计从2030年左右开始，出版物数量将大幅加速增长，呈现远超仅靠人力增长的趋势。

可以预见，由上面这些机制共同作用，未来可能创造一种科学知识增长的复合效应，这种变革的最终结果将是重新定义人类文明探索未知世界的能力边界，形成所谓科学发现的“新规模法则”，开启一个真正的“科学发现摩尔定律”时代。

二、自主通用科学家：架构与能力

成熟的AGS将不仅仅是一个单一的系统，我们可以把它想象成一位科研界的“多面手”，或者一个高度协同的“科研梦之队”，其整合了AI智能体和实体机器人的综合框架，具备在虚拟和物理环境中通用的操作能力，核心由五大功能模块构成，并通过内部互动和反思机制不断进化，从而构成了完整的研究生命周期，如图4所示：

图4 基于AI智能体和机器人的自主通用科学家框架。科学智能体/机器人可以加速科学研究进程并弥合不同学科科学知识之间的鸿沟

1.文献综述（Literature Review）模块：不仅仅是关键词搜索，而是能够像人类研究员一样，自主进行全面的研究分析，模拟人类与学术数据库和期刊平台的交互，导航各种数字环境、甚至克服订阅障碍以搜索、访问和管理相关文献。由此做出一个领域从开山鼻祖到最新进展的所有关键文献综述，并指出知识的空白和矛盾之处。如表1所示，论文中特别强调了操作系统级智能体（OS agents）的重要性，这种“直接与网站和应用程序交互”、模拟人类在电脑上操作的能力，一部分已在通用智能体，如 Manus 在虚拟环境中使用“Browser use” 和(hé) “Computer use”等(děng)交(jiāo)互(hù)方(fāng)式(shì)实(shí)现(xiàn)。

表(biǎo)1 现(xiàn)有(yǒu)系(xì)统(tǒng)和(hé)AGS系(xì)统(tǒng)的(de)文献(xiàn)检(jiǎn)索(suǒ)与(yǔ)操(cāo)作(zuò)任(rèn)务(wu)方(fāng)法(fǎ)比(bǐ)较(jiào)

2.提(tí)案(àn)生(shēng)成(chéng)（Proposal Generation）模(mó)块(kuài)：制(zhì)定(dìng)全面(miàn)的(de)研(yán)究(jiū)提(tí)案(àn)，包(bāo)括(kuò)精(jīng)确(què)的(de)问(wèn)题(tí)陈(chén)述(shù)、明(míng)确(què)的(de)目(mù)标(biāo)和(hé)创(chuàng)新(xīn)的(de)假(jiǎ)设(shè)，发(fā)展(zhǎn)详(xiáng)细(xì)的(de)方(fāng)法(fǎ)框(kuāng)架(jià)和(hé)实(shí)验(yàn)协(xié)议(yì)。在(zài)充(chōng)分(fēn)“消(xiāo)化(huà)”文献(xiàn)之(zhī)后(hòu)，AGS会(huì)着(zhe)手(shǒu)撰(zhuàn)写(xiě)一(yī)份(fèn)全面(miàn)的(de)研(yán)究(jiū)计(jì)划(huà)书(shū)。它(tā)会(huì)明(míng)确(què)提(tí)出(chū)问(wèn)题(tí)、设(shè)定(dìng)清(qīng)晰(xī)的(de)目(mù)标(biāo)，并(bìng)形(xíng)成(chéng)具(jù)有(yǒu)前(qián)瞻(zhān)性(xìng)的(de)创(chuàng)新(xīn)假(jiǎ)说(shuō)。更(gèng)重(zhòng)要(yào)的(de)是(shì)，它(tā)会(huì)设(shè)计(jì)详(xiáng)细(xì)的(de)方(fāng)法(fǎ)论(lùn)框(kuāng)架(jià)和(hé)实(shí)验(yàn)方(fāng)案(àn)，兼(jiān)顾(gù)虚(xū)拟(nǐ)模(mó)拟(nǐ)和(hé)物(wù)理(lǐ)实(shí)施(shī)的(de)可(kě)行(xíng)性(xìng)，为(wèi)后(hòu)续(xù)研(yán)究(jiū)铺(pù)设(shè)清(qīng)晰(xī)的(de)路线(xiàn)图(tú)。正(zhèng)如(rú)论(lùn)文所(suǒ)述(shù)，“大(dà)型(xíng)语(yǔ)言(yán)模(mó)型(xíng)产(chǎn)生(shēng)的(de)想(xiǎng)法(fǎ)在(zài)创(chuàng)新(xīn)性(xìng)上(shàng)持(chí)续(xù)表(biǎo)现(xiàn)出(chū)高(gāo)于(yú)人(rén)类(lèi)专(zhuān)家(jiā)的(de)水(shuǐ)平(píng)。” AGS将(jiāng)这(zhè)种(zhǒng)能(néng)力(lì)系(xì)统(tǒng)化(huà)，通(tōng)过(guò)自(zì)动(dòng)化(huà)的(de)差(chà)距(jù)分(fēn)析(xī)、严(yán)谨(jǐn)的(de)问(wèn)题(tí)陈(chén)述(shù)、可(kě)测(cè)试(shì)的(de)假(jiǎ)说(shuō)构(gòu)建(jiàn)、以(yǐ)及(jí)周(zhōu)密(mì)的(de)方(fāng)法(fǎ)设(shè)计(jì)，确(què)保(bǎo)研(yán)究(jiū)提(tí)案(àn)的(de)质(zhì)量(liàng)。

3.实(shí)验(yàn)（Experimentation）模(mó)块(kuài)：协(xié)调(diào)研(yán)究(jiū)过(guò)程(chéng)的(de)实(shí)验(yàn)阶(jiē)段(duàn)，包(bāo)括(kuò)精(jīng)确(què)规(guī)划、资源优化和在虚拟与物理环境中的试验执行。系统将通过持续分析实时结果和反馈，动态优化实验设计。这是AGS真正展现其“手脑并用”能力的舞台。借助先进的机器人技术和AI算法，AGS可以执行精密的物理操作，收集经验数据，并进行虚拟实验。它还能根据实时结果和反馈动态调整实验设计。论文特别地指出，当前AI在虚拟实验中表现出色，但在物理实验自动化方面仍有巨大鸿沟。 AGS致力于弥合这一差距，通过整合具身AI的机器人系统，使其能够在化学、材料科学等领域完成从分子预测到物理合成与表征的全流(liú)程(chéng)。

4.手(shǒu)稿(gǎo)准(zhǔn)备(bèi)（Manuscript Preparation）模(mó)块(kuài)：实(shí)验(yàn)完(wán)成(chéng)后(hòu)，AGS会(huì)将(jiāng)研(yán)究(jiū)成(chéng)果(guǒ)综(zōng)合(hé)成(chéng)一(yī)篇(piān)符(fú)合(hé)发(fā)表(biǎo)标(biāo)准(zhǔn)的(de)学(xué)术(shù)手(shǒu)稿(gǎo)。它(tā)会(huì)进(jìn)行(xíng)全面(miàn)的(de)数(shù)据(jù)分(fēn)析(xī)，解(jiě)读(dú)结(jié)果(guǒ)，并(bìng)阐(chǎn)述(shù)实(shí)质(zhì)性(xìng)的(de)结(jié)论(lùn)。该(gāi)系(xì)统(tǒng)能(néng)按(àn)照(zhào)标(biāo)准(zhǔn)的(de)学(xué)术(shù)规(guī)范(fàn)构(gòu)建(jiàn)文档(dàng)——包(bāo)括(kuò)方(fāng)法(fǎ)细(xì)节(jié)、结(jié)果(guǒ)展(zhǎn)示(shì)和(hé)理(lǐ)论(lùn)讨(tǎo)论(lùn)——同(tóng)时(shí)进(jìn)行(xíng)内(nèi)部(bù)质(zhì)量(liàng)评(píng)估(gū)，并(bìng)能(néng)与(yǔ)模(mó)拟(nǐ)的(de)同(tóng)行(xíng)评(píng)审(shěn)机(jī)制(zhì)互(hù)动(dòng)，确(què)保(bǎo)学(xué)术(shù)严(yán)谨(jǐn)性(xìng)。论(lùn)文提(tí)到(dào)，AI系(xì)统(tǒng)可(kě)以(yǐ)辅(fǔ)助(zhù)起(qǐ)草(cǎo)手(shǒu)稿(gǎo)的(de)各(gè)个(gè)部(bù)分(fēn)，从(cóng)引(yǐn)言(yán)到(dào)讨(tǎo)论(lùn)，甚(shén)至(zhì)处(chù)理(lǐ)复(fù)杂(zá)的(de)数(shù)学(xué)公(gōng)式(shì)和(hé)文献(xiàn)引(yǐn)用(yòng)。

5.反(fǎn)思(sī)与(yǔ)反(fǎn)馈(kuì)（Reflection and Feedback）模(mó)块(kuài)：这(zhè)个(gè)模(mó)块(kuài)将(jiāng)建(jiàn)立(lì)功(gōng)能(néng)组(zǔ)件(jiàn)之(zhī)间(jiān)的(de)通(tōng)信(xìn)渠(qú)道(dào)，以(yǐ)便(biàn)进(jìn)行(xíng)实(shí)时(shí)调(diào)整(zhěng)，同(tóng)时(shí)整(zhěng)合(hé)来(lái)自(zì)人(rén)类(lèi)合(hé)作(zuò)者(zhě)和(hé)模(mó)拟(nǐ)同(tóng)行(xíng)评(píng)估(gū)的(de)外(wài)部(bù)输(shū)入(rù)。这(zhè)赋(fù)予(yǔ)了(le)AGS持(chí)续(xù)学(xué)习(xí)和(hé)进(jìn)化(huà)的(de)能(néng)力(lì)。通(tōng)过(guò)系(xì)统(tǒng)分(fēn)析(xī)这(zhè)些(xiē)反(fǎn)馈(kuì)，AGS能(néng)够(gòu)优(yōu)化(huà)假(jiǎ)说(shuō)、方(fāng)法(fǎ)论(lùn)和(hé)实(shí)验(yàn)途(tú)径，确(què)保(bǎo)研(yán)究(jiū)对(duì)新(xīn)兴(xìng)发(fā)展(zhǎn)保(bǎo)持(chí)敏(mǐn)感(gǎn)，并(bìng)最(zuì)大(dà)化(huà)科(kē)学(xué)产(chǎn)出(chū)的(de)最(zuì)终(zhōng)影(yǐng)响(xiǎng)和(hé)质(zhì)量(liàng)。

而(ér)要(yào)理(lǐ)解(jiě)AGS如(rú)何(hé)实(shí)现(xiàn)如(rú)此(cǐ)复(fù)杂(zá)的(de)自(zì)主科(kē)研(yán)能(néng)力(lì)，就(jiù)必(bì)须(xū)深(shēn)入(rù)其(qí)“大(dà)脑(nǎo)”，这(zhè)是(shì)其(qí)认(rèn)知(zhī)与(yǔ)决(jué)策(cè)的(de)核(hé)心(xīn)（图(tú)5）。AGS的(de)大(dà)脑(nǎo)框(kuāng)架(jià)分(fēn)为(wèi)外(wài)循(xún)环(huán)和(hé)内(nèi)循(xún)环(huán)两(liǎng)部(bù)：
•外(wài)循(xún)环(huán)：负(fù)责(zé)人(rén)与(yǔ)环(huán)境(jìng)的(de)交(jiāo)互(hù)，通(tōng)过(guò)感(gǎn)知(zhī)（Perception）从(cóng)环(huán)境(jìng)（Environment，包(bāo)括(kuò)人(rén)类(lèi)交(jiāo)互(hù)）获(huò)取(qǔ)信(xìn)息(xi)，经(jīng)过(guò)大(dà)语(yǔ)言(yán)模(mó)型(xíng)大(dà)脑(nǎo)（LFMs Brain）处(chù)理(lǐ)后(hòu)，通(tōng)过(guò)行(xíng)动(dòng)（Action）影(yǐng)响(xiǎng)环(huán)境(jìng)，行(xíng)动(dòng)方(fāng)式(shì)包(bāo)括(kuò)使(shǐ)用(yòng)/创(chuàng)造(zào)工(gōng)具(jù)（Use/create tools），利(lì)用(yòng)具(jù)身(shēn)机(jī)器(qì)人(rén)（Embodied Robot）在(zài)物(wù)理(lǐ)（Physical）环(huán)境(jìng)中(zhōng)操(cāo)作(zuò)，或(huò)在(zài)虚拟（Virtual）环境中进行。大语言模型大脑内部包含记忆（Memory）、思考（Thinking）、知识（Knowledge）和学习（Learning）等认知过程。

•内循环：是一个自持续的思考循环（Self continuous thinking loop），它接收内部/外部信息（Internal/External infos，如时间、硬件、计算资源、环境等），进行自我反思（Self-reflect）和基于思考的奖励（Reward in Thought，即自我奖励 Self reward），然后进入规划/推理（Planning/Reasoning）阶段（采用思维链 Chain of Thought，思维树 Tree of Thought，蒙特卡洛树搜索 MCTS，内部推理 Internal reasoning等方法），最终做出决策（Decision Making），完成认知（Cognition）过程。

图5 AGS的大脑框架

三、自动科学发现的级别与演化：从环境交互到自主先锋

研究团队提出了科学发现自动化的分类框架，将AGS划分为不同级别，基于其自主程度、与模拟和现实环境的交互以及整体研究能力（表2）：

表2 AGS划分的不同级别

•等级0：无AI（No AI）：纯粹的人类科学家，使用传统的、非AI驱动的工具和方法。如化学中的光谱设备和分析平台，或公共卫生中的统计软件和流行病学建模工具。

•等级1：工具辅助（Tool-Assisted）：人类仍是主导，AI 作为简单工具出现，辅助研究者完成特定、狭窄的任务，例如ChatGPT提供文本辅助，基础机器学习模型处理数据。

•等级2：智能助手（Intelligent Assistant）：AI系统升级为复杂的研究助手，能在人类监督下自主进行网络信息搜集、虚拟模拟和整合不同学科的见解，例如OpenDevin、DeepResearch 等系统。

•等级3：协作伙伴（Collaborative Partner）：AI系统进化为自主的科研合作伙伴，能够无缝整合虚拟和物理环境的互动。配备先进机器人后，它们可以在生物学、工程学等领域进行精确的物理操作，但仍与人类科学家合作。这好比一个经验丰富的博士后，可以独立承担一部分复杂的跨学科任务。

•等级4：自主研究员（Autonomous Researcher）：AI在此阶段以高度独立的方式运作，仅需极少的人类指导。它们能进行高级研究，自主检索信息，综合多领域知识，甚至产生全新的见解并提出创新方案。 “通用人工智能机器人”（Artificial General Intelligence Robots，AGIR）是这一级别的代表。

•等级5：先锋（Pioneer）：这是AGS的终极形态——“人工超级智能机器人”（Artificial SuperIntelligence Robots，ASIR）。它们完全自主，超越人类的科研能力，能够在所有环境中完全独立地操作，不仅综合跨学科知识，还能创新并形成全新的科学原理，产生前所未有的科学发现，制定全新的科学原则，引领科学前沿。

由上所述，从等级3开始，AGS系统的关键创新在于将智能AI与先进机器人技术相结合，创建能够管理复杂研究流程并在物理(lǐ)世界中执行实验的完整系统。正如研究者所说：“将LLM（大型语言模型）与机器人系统整合，如 ROS-LLM平台所展示的，能够在实验过程中进行结构化推理和明智决策，优化资源利用和实验结果进行研究。”

在虚拟环境中，AI智能体能够执行算法，进行复杂的数据分析，处理逻辑和文本信息，设计和执行复杂的模拟，为后续物理实验提供宝贵的见解和预测。而在物理环境中，具有“世界模型”（world models）的“具身AI”（Embodied AI）和“通用机器人”（General-Purpose Robotics），则(zé)负(fù)责(zé)执(zhí)行(xíng)复(fù)杂(zá)的(de)物(wù)理(lǐ)操(cāo)作(zuò)，具(jù)备(bèi)精(jīng)确(què)性(xìng)和(hé)适(shì)应(yīng)性(xìng)。这(zhè)些(xiē)通(tōng)用(yòng)机(jī)器(qì)人(rén)能(néng)够(gòu)执(zhí)行(xíng)各种实验协议，处理材料，操作设备，并根据感官反馈进行实时调整。

在图6中，我们可以看到从2020年左右开始，科研自动化水平的演进。从人类使用工具（虚拟、物理），到基于聊天的知识提供者（如ChatGPT），再到能在虚拟环境中自主工作的智能体（如Devin，Autogen），然后是能在物理和虚拟环境中均自主工作的机器人（如Co-scientist，具备高级操作能力），预计到203X年左右达到人类，即多数硕士、博士、研究科学家的水平，成为通用具身智能机器人，覆盖无限科学领域，最终迈向超越人类科学家水平，引领科学研究发展走向。

图6 不同自动化级别的自动研究时间线

在图7中，则追溯了机器人科学家从2004年的“机器人科学家”概念，到2004年的Robot Scientist，2009年的 Adam（RD.K），2019年的PaperRobot，2020年的移动机器人化学家，2023年的Coscientist，2024年的研究智能体（如Nova，ORGANA）、AI科学家（MIT SciAgents），到2025年谷歌的AI合作科学家、AMD的Agent Lab，并展望2030+年实现AGS。图中不同颜色的条带代表了不同类型的研究：特定领域的机(jī)器(qì)人(rén)与(yǔ)机(jī)器(qì)学(xué)习(xí)研(yán)究(jiū)、特(tè)定(dìng)领(lǐng)域的(de)AI与(yǔ)机(jī)器(qì)人(rén)研(yán)究(jiū)、特(tè)定(dìng)领(lǐng)域的(de)AI智(zhì)能(néng)体(tǐ)研(yán)究(jiū)，以(yǐ)及(jí)最(zuì)终(zhōng)的(de)通(tōng)用(yòng)多(duō)领(lǐng)域具(jù)身AI机器人研究。

图7 机器人科学家进化概览

AGS概念最令人兴奋的可能性之一是能够超越人类身体极限，将科学探索扩展到人类无法或难以进入的极端环境。研究团队设想机器人科学家能够在太空探索、深海研究和微观尺度等领域开展独立科学探究。

想象机器人科学家在月球和火星上建立研究基地，在太阳系内甚至更远处进行科学探索。同样，在地球深海，这些系统可以在巨大压力、永久黑暗和远离人类支持的环境中工作，探索热液喷口、研究独特生态系统并监测地质活动。此外，机器人科学家的能力还延伸到微观和纳米尺度，可以在先进材料科学、人体内靶向药物递送或微观污染物环境监测等领域开展独立科学探究。正如研究者指出：“随着技术的持续进步，通过超越人类物理限制的系统探索和发现，这些系统将会显著增强我们对宇宙、地球以及物质基本构建块的理解。”

此外，研究团队还提出了一个有趣的问题：AGS 如何管理和传播它们的研究成果？传统学术系统主要为人类研究者设计，可能难以处理自主系统生成的出版物和提案。为此，研究者效仿人类的预印本论文平台 Arxiv，提出建立一个名为 aiXiv 的中介平台，如图8所示，作为自主系统生成研究的开放预印本服务器，实施专门针对AI驱动发现特点的分层审查流程。这种方法旨在确保AI生成的研究遵循透明度和可信度原则，同时解决与非人类作者相关的科学交流伦理考虑。

图8 AI和机器人科学家产生提案或论文，提交至 aiXiv 服务器的过程框架

AGS概念令人振奋，但实现完全自主的科学研究系统仍面临重大挑战，例如感知与操作能力、自主性与决策能力：适应性与泛化能力、物理安全性、人类水平交互、伦理与法律问题等等。不过，随着时间发展，相关难题正在逐一攻克中。

就在前不久， DeepMind 已经发布了 AlphaEvolve 系统，已经实现了自主优化算法、训练自身，从而实现能力进化，不仅改进了计算效率，还在多个数学和计算机科学难题上取得突破性进展。例如，在矩阵乘法优化研究中，打破了 56 年未能突破的计算效率，将 4×4 复值矩阵运算次数从49 降至48。此外，它还优化了 Google 数(shù)据(jù)中(zhōng)心的计算资源调度，提高了 AI 训练效率，节约了0.7%的算力资源，它还改进Gemini的大规模矩阵运算算法，最终使整体训练时间缩短了1%。

集智俱乐部关于AlphaEvolve的报道：Nature：DeepMind发布重磅通用科学人工智能体

AlphaEvolve 系统本质是在模拟生物进化的过程来优化程序生成（图9）。其中提示采样器（prompt sampler）就像是“环境选择压力”，它根据当前最优秀的程序来构造新的提示；语言模型则充当“基因变异”的角色，基于这些提示产生新的程序变体(tǐ)；评(píng)估(gū)器(qì)相(xiāng)当(dāng)于(yú)“自(zì)然(rán)选(xuǎn)择(zé)”机(jī)制(zhì)，判(pàn)断(duàn)哪(nǎ)些(xiē)程(chéng)序(xù)表(biǎo)现(xiàn)更(gèng)好(hǎo)；而(ér)程(chéng)序(xù)数(shù)据(jù)库(kù)就(jiù)是(shì)“基(jī)因(yīn)库(kù)”，保(bǎo)存(cún)着(zhe)经(jīng)过(guò)筛(shāi)选(xuǎn)的(de)优(yōu)秀(xiù)程(chéng)序(xù)，并(bìng)通(tōng)过(guò)进(jìn)化(huà)算(suàn)法(fǎ)决(jué)定(dìng)哪(nǎ)些(xiē)“基(jī)因”（程序）应该被传递到下一代。

图9 AlphaEvolve 提示采样器的工作流程：首先给语言模型组装提示，然后语言模型生成新的程序。这些程序由评估器进行评估并存储在程序数据库中。该数据库实现了一种进化算法，用于确定哪些程序将被用于未来的提示生成。

由此可见，AlphaEvolve 的出现已经向AGS迈出了重要一步，它已经相当于达到了缺乏物理和实验操作的AGS大约3-4级水平。

总之，AGS代表了科学研究彻底转变的重要一步。就像显微镜和望远镜如何扩展了我们观察微观和宏观世界的能力，这些自主系统可能会扩展我们进行科学探索的范围和速度。这不仅是科学工具的演变，更是科学本身的转变——将科学探索的边界推向前所未有的高度，开创更高效、更具创新性的科学研究方法，超越当前限制，最终加速整个人类文明的进步。

本文为•创作培育计划扶持作品

作者：于春景

审核：张江北京师范大学系统科学学院教授

出品：中国科协科普部

监制：中国科学技术出版社有限公司、北京中科星河文化传媒有限公司