官方网站-首页官方网站-首页

新闻中心

NEWS CENTER

新闻中心 媒体报道 追问大模型“思考”:它真的懂这个世界吗?

追问大模型“思考”:它真的懂这个世界吗?

发布时间:2025-08-29 09:00:29

阅读量:304次

【导语】当AI大模型展现出惊人的逻辑推理能力时,我们不禁要问:它们真的在思考吗?专家们的争论如火如荼,有人认为这是AI认知的革命,也有人视其为语言幻觉。本文将揭示大模型思考的本质,探讨其模拟思考的技术手段,并指出其致命漏洞。在依赖大模型做决策日益普遍的今天,我们更应清醒认识到:大模型的思考是一种工具能力,可用但不可信,真正的思考在于理解意义。

当大模型写出逻辑缜密的报告、解出复杂的数学难题,我们总会不自觉问:这些大模型,是真的在思考吗?打开搜索引擎,专家们的争论早已白热化,有人把大模型的推理能力称作AI认知革命,也有人直言这只是流畅语言包装的幻觉。

要弄清大模型怎么思考,首先得打破一个误区:大模型的思考,和人类的思考从本质上就不是一回事。

三大技术模拟思考效果

人类的思考,是基于对世界的真实理解:我们看到苹果落地,会联系重力、质量等物理概念,甚至联想到万有引力的发现故事;而大模型的思考,本质是一场基于数据和算法的精密模拟,不会理解概念,只会根据海量训练数据,预测接下来该说什么才符合逻辑。

需要指出的是,不要把大模(mó)型(xíng)输(shū)出(chū)的(de)流(liú)畅(chàng)性(xìng),错(cuò)当(dāng)成(chéng)对(duì)事(shì)物(wù)的(de)理(lǐ)解(jiě)。大(dà)模(mó)型(xíng)能(néng)输(shū)出因为地球有重力,所以苹果会落地,但大模型不会真的知道重力是什么,也不会像人类一样抬头观察苹果坠落的轨迹,只是从训练过的文本里(lǐ),学(xué)到(dào)了(le)重(zhòng)力(lì)和(hé)苹(píng)果(guǒ)落(luò)地(de)这(zhè)两(liǎng)个(gè)概(gài)念(niàn)的(de)关联规律。

尽管没有真正的认知能力,但如今的大模型能靠技术手段,模拟出一步步思考的效果。具体来看:

第一,推理时拆步骤。部分企业提及的推理时推理(Inference-Time Reasoning)技术,核心是让大模型在输出答案前,先写下思考步骤,这就是思维链提示(Chain-of-Thought Prompting)。

比如面对“小明(míng)有(yǒu)5个(gè)苹(píng)果(guǒ),给了小红2个,又买了3个,现在有几个?”这个问题,普通模型可能直接输出6个,而支持思维链的模型会先写:“第一步,算小明给小红后剩下的苹果:5-2=3;第二步,算买完后的数量:3+3=6;所以答案是6。”

这种拆步骤的过程,看起来像人类在逐步思考,但本质是大模型根据提示,模仿人类解题的文本格式,其实仍然不会理解减法加法的实际意义,只是按训练数据里的解题模板生成逻辑链。

第二,架构上优先推理。一些新推出的大模型系列,主打推理优先,相当于从模型设计阶段,就强化了逻辑推演的权重,不只是在输出时拆步骤,还会在处理问题时,先调用逻辑模块分析问题类型,再决定是否需要调用工具、访问数据库。

比如你问“某年份全球新能源汽车销量Top3的品牌是哪些?”,普通模型可能直接输出训练数据里的旧数据,而采用推理优先(xiān)架(jià)构的模型会先判断:“这个问题需要最新数据,我的训练数据截止到前一年,所以得调用数据库查目标年份的最新数据。”

这种先判断再行动的过程,看起来像在规划思考路径,但本质是模型内置的规则在起作用,那就是能够识别需要实时数据的问题特征,却不会理解为什么需要最新数据。

第三,借工具补短板。不少前沿大模型的进步,很大程度体现在多模态+工(gōng)具(jù)整(zhěng)合(hé)上(shàng):它(tā)们(men)能(néng)处(chù)理(lǐ)图(tú)片(piàn)、生(shēng)成(chéng)代(dài)码(mǎ),还(hái)能(néng)调(diào)用(yòng)计(jì)算(suàn)器(qì)、查(chá)阅(yuè)文献(xiàn),甚(shén)至(zhì)连(lián)接(jiē)数(shù)据(jù)库(kù)。

当(dāng)你(nǐ)让(ràng)大(dà)模(mó)型(xíng)分析一篇PDF论文的核心观点,它会先调用PDF解析工具提取文本,再用逻辑模块梳理观点,整个过程像极了人类找资料、做总结的思考流程。

但别忘了,工具只是大模型的延伸手脚,不是延伸大脑,能调用计算器算出复杂的数学题,却不会理解计算结果的意义;能查文献总结观点,却不会像人类一样对观点提出质疑,只是按预设流程,把工具的输出整合成符合逻辑的答案。

大模型思考的致命漏洞

再精密的模拟,也藏不住大模型思考的先天缺陷。一方面,大模型会像人类一样尝试多种解题策略,比(bǐ)如(rú)解(jiě)一(yī)道复杂的数学题时,先试代数方法,不行再试几何模型,甚至会编写简单代码验证思路;但另一方面,很多推理路径里都存在幻觉,比如凭空捏造一个不存在的定理,或者把两个无关的公式强行结合,最后得出一个看似合理、实则错误的结论。

更关键的是,大模型无法像人类一样自我纠错。人类在思考时,会不断反问自己这个步骤对吗?有没有漏洞?但大模型只会沿着看起来符合逻辑的方向走,一旦第一步出现幻觉,后面的推理只会越错越远。

写在最后:

当人们开始用大模型做决策,当企业依赖大模型生成报告,我们更需要清醒:大模型的思考是一种可用但不可信的工具能力,它能帮我们节省时间、拓宽思路,但不能替代人类的判断。毕竟,真正的思考从不止于符合逻辑,更在于理解意义。

供稿单位:重庆天极网络有限公司

审核专家:李志高 高级工程师/重庆天极网络有限公司总裁

声明:除原创内容及特别说明之外,部分图片来源网络,非商业用途,仅作为科普传播素材,版权归原作者所有,若有侵权,请联系删除。

前一篇:“中国天眼”FAST的“锅”底,为什么故意缺了一块?丨观天巨眼 返回列表 下一篇:建立算力中心需要多大的电量? 一场数字时代的“电力大考”

相关新闻

中国“人造太阳”找到突破密度极限方法

2026-01-04

中国“人造太阳”找到突破密度极限方法

听歌时身体的一个小动作,揭穿了大脑的工作真相

2026-01-04

听歌时身体的一个小动作,揭穿了大脑的工作真相

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

2026-01-03

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

云平台应用案例

帮助企业低成本、高效率、专业化建立属于自己的工业互联网平台!

立即咨询