官方网站-首页发布时间:2025-03-07 08:54:17
阅读量:476次

今(jīn)年(nián)年(nián)初(chū),中(zhōng)国(guó)深(shēn)度(dù)求(qiú)索(suǒ)公(gōng)司(sī)发(fā)布(bù)推(tuī)理(lǐ)型(xíng)大(dà)模(mó)型(xíng)DeepSeek-R1(以(yǐ)下(xià)简(jiǎn)称(chēng)DeepSeek)引(yǐn)爆(bào)热(rè)搜(sōu),引(yǐn)起(qǐ)全球(qiú)广(guǎng)泛(fàn)关注(zhù)。
大(dà)家(jiā)跃(yuè)跃(yuè)欲(yù)试(shì)
向(xiàng)它(tā)提(tí)问(wèn)专(zhuān)业(yè)问(wèn)题(tí)
输(shū)出(chū)工(gōng)作(zuò)方(fāng)案(àn)
甚(shén)至(zhì)聊(liáo)起(qǐ)了(le)个(gè)人(rén)情(qíng)感(gǎn)问(wèn)题(tí)

截(jié)图(tú)自(zì)Deepseek官(guān)网(wǎng)聊(liáo)天(tiān)对(duì)话(huà)框(kuāng)
年(nián)轻(qīng)人(rén)的(de)“深(shēn)夜(yè)树(shù)洞(dòng)”
不(bù)少(shǎo)网(wǎng)友(you)纷(fēn)纷(fēn)晒(shài)出(chū)自(zì)己(jǐ)和(hé)它(tā)的(de)对(duì)话(huà),并(bìng)表(biǎo)示(shì)被(bèi)感(gǎn)动(dòng)到(dào)“泪(lèi)目(mù)”,频(pín)频(pín)破(pò)防(fáng)。一(yī)起(qǐ)来感受下:
Q
连续一周每天只睡4小时改方案,但领导还是不满意,说我没用心。我是不是很差劲?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
毕业三年工资不高,同学晒房晒车,感觉我的人生好失败,没有方向。到底怎么才能跳出现在的困境?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
Q
跟前男友分手了,但睡前还是手贱忍不住搜他微博…朋友说我恋爱脑,但没人知道我每晚难过走不出来的心情,我该怎么办?
Deepseek回答:


本回答由 AI 生成,仅供参考,不构成任何专业建议。
DeepSeek为什么这么火?
DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,依托幻方量化顶尖的金融AI团队,将量化领域高频交易中的算法优化能力迁移至大模型研发,其自研AI-HPC架构使训练效率提升10-20倍,形成技术先发优势。
具体来说,火出圈的是DeepSeek-R1推理模型,擅长处理复杂任务且可免费商用。

图源《DeepSeek从入门到精通-清华大学版》
爆火的其中一个重要契机,是有网友指出DeepSeek-R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。通过FP8混合精度训练、混合专家(MoE)架构等创新,训练成本仅为GPT系列的1/10-1/20,API定价压至同业1/27,或能破解行业成本困局。
此外,在用户使用过程中确实能感受到,DeepSeek-R1的自然语言、逻辑推理等能力的实现标志着AI技术在认知和应用层面达到了新高度。
AI的“治愈力”从何而来?

喂养海量案例素材
测试显示,当用户倾诉“工作压力大”时,人类常给出“放松点”等模糊回应,而AI会分步骤引导分析压力源,这与AI被“投喂”的海量心理咨询案例训练直接相关。
大模型学习的不只是知识,更是数十亿人的情感表达(如小说对白、心理咨询记录、影视台词)。

deepseek指导生成
像婴儿通过观察大人学习“何时该给拥抱”,AI在被RLHF训练(奖励函数操控)时,标注员会(huì)更(gèng)倾(qīng)向(xiàng)选(xuǎn)择(zé)“渐(jiàn)进(jìn)式(shì)引(yǐn)导(dǎo)”的(de)答(dá)案(àn),导(dǎo)致(zhì)AI自(zì)动(dòng)优(yōu)化(huà)出(chū)“先(xiān)认(rèn)同(tóng)-再(zài)分(fēn)析(xī)-后(hòu)建(jiàn)议(yì)”的(de)三(sān)段(duàn)式(shì)结(jié)构(gòu)。
相(xiāng)较(jiào)于(yú)传(chuán)统(tǒng)大(dà)模(mó)型(xíng)以(yǐ)自(zì)然(rán)语(yǔ)言(yán)和(hé)多(duō)语(yǔ)言(yán)交(jiāo)互(hù)以(yǐ)及(jí)连(lián)续(xù)对(duì)话(huà)的(de)方(fāng)式(shì),实(shí)现(xiàn)了(le)从(cóng)“模(mó)糊(hu)搜(sōu)索(suǒ)”到(dào)“精(jīng)准(zhǔn)推(tuī)送(sòng)”的(de)升(shēng)级(jí),DeepSeek能(néng)够通过构建语义网络(luò)和(hé)模(mó)拟(nǐ)人(rén)类(lèi)逻(luó)辑(ji)路径,实(shí)现(xiàn)从(cóng)“信(xìn)息(xi)匹(pǐ)配(pèi)”到(dào)“知(zhī)识(shi)推(tuī)演(yǎn)”的(de)跨(kuà)越(yuè)。
双(shuāng)轨(guǐ)训(xun)练(liàn)机(jī)制(zhì)
在(zài)海(hǎi)量(liàng)数(shù)据(jù)的(de)基(jī)础(chǔ)上(shàng),DeepSeek-Rl采用(yòng)独(dú)有(yǒu)的(de)双(shuāng)轨(guǐ)训(xun)练(liàn)机(jī)制(zhì)。一方面,它能够深入学习将复杂问题拆解为简单子问题的方法,进而逐步解决复杂问题,显著提升复杂问题的拆解能力。
另一方面,它采用了无监督强化学习技术,突破传统训练范式的局限(通常依赖大量标注数据),使DeepSeek-R1在有限标注数据的情况下,仍能维持卓越的推理性能。

deepseek指导生成
这种创新的技术路径,实现了推理过程的自我反思与迭(dié)代(dài)优(yōu)化(huà)。如(rú)同(tóng)人(rén)类(lèi)在(zài)解(jiě)决(jué)问(wèn)题(tí)时(shí)会(huì)不(bù)断(duàn)总(zǒng)结(jié)经(jīng)验(yàn)、反(fǎn)思(sī)方(fāng)法(fǎ),DeepSeek-R1也(yě)会在推理过程中能够持续优化自身推理策略,形成类似人类的问题解决思维链。
AI的“高情商”不是真情感
但值得注意的是,AI不懂悲伤,只能模拟“悲伤时人类最需要的对话流”。RLHF(基于人(rén)类(lèi)反(fǎn)馈(kuì)的(de)强(qiáng)化(huà)学习)让AI从“正确率”迭代到“让人类舒服的回答”,掌握“共情话术”,但无法区分小说剧情与现实困境。
在上述案例中,Deepseek会将“失恋”自动关联到关键词“背叛”“自我(wǒ)价(jià)值”……从而触发预设安慰框架,选择大量运算结果中最有可能符合人类情感需求的内容。
例如,当AI说“我理解你的痛苦”,实则是数据统计显示这句话最可能提升用户满意度。

deepseek指导生成
DeepSeek等AI开始展示出其能够站在他人立场思考问题的能力,即“他者视角”。但机器没有肉身,“自我”情感和冲动也没有根植之处。我们在使用过程中,应保持理性和辩证思维,避免过度依赖AI导致情感降级(如把AI当心理医生)。
也许真正治愈我们的不是AI的答案
而(ér)是(shì)在(zài)提(tí)问的瞬间
我们第一(yī)次(cì)对(duì)自(zì)己(jǐ)如此坦诚
作者:蝌蚪君
审核:刘颖 李培元