官方网站-首页官方网站-首页

新闻中心

NEWS CENTER

新闻中心 媒体报道 写在DeepSeek爆火之后:AI发展得如此之快,未来会越来越快吗?

写在DeepSeek爆火之后:AI发展得如此之快,未来会越来越快吗?

发布时间:2025-03-16 08:30:28

阅读量:475次

出品:

作者:王琛(中国科学院计算技术研究所在读博士)

监制:中国科普博览

编者按:为展现智能科技动态,前沿科技项目推出“人工智能”系列文章,一窥人工智能前沿进展,回应种种关切与好奇。让我们共同探究,迎接智能时代。

最近,DeepSeek作为AI界一位“新顶(dǐng)流(liú)”,凭(píng)借(jiè)强(qiáng)大(dà)的(de)功(gōng)能(néng)在(zài)社(shè)交(jiāo)媒(méi)体(tǐ)上(shàng)引(yǐn)发(fā)热(rè)议(yì)。有(yǒu)人(rén)说(shuō)它(tā)是(shì)未(wèi)来(lái)的(de)生(shēng)产(chǎn)力(lì)工(gōng)具(jù),有(yǒu)人(rén)好(hǎo)奇(qí)它(tā)能(néng)为(wèi)生(shēng)活(huó)带(dài)来(lái)哪(nǎ)些(xiē)改变,也有人担心它会抢走自己的饭碗……

为了让大家更加了解这个备受关注的智能帮手,我们邀请了中国科学院计算技术研究所在读博士王琛,用10个问题全面解答关于DeepSeek的核心原理、使用技巧以及未来趋势等疑问。无论是AI小白还是科技达人,这篇文章都能为你答疑解惑!让我们一起看看,这个“智能帮手”能否成为我们生活中的真正伙伴吧!

DeepSeek在春节期间受到全球的关注,现在许多平台(tái)都(dōu)表(biǎo)示(shì)已(yǐ)经(jīng)接入DeepSeek大模型,它究竟是什么?

DeepSeek是一家位于杭州的人工智能初创公司,由幻方量化联合创始人梁文峰于2023年7月创立,专注于大语言模型的研发(fā)。

在(zài)春(chūn)节(jié)前,DeepSeek相继发布了两款同名的开源大语言模型:DeepSeek-V3(2024年12月26日)和DeepSeek-R1(2025年1月20日)。它们的性能可以与OpenAI的闭源模型GPT-4o和o1等其它大语言模型相媲美,且成本明显低于其它模型。

DeepSeek-V3模型旨在提供高性价比的服务,能够快速(sù)地(de)响(xiǎng)应(yīng)用(yòng)户(hù)的(de)需(xū)求(qiú),满(mǎn)足(zú)自(zì)然(rán)语(yǔ)言(yán)处(chù)理(lǐ)、问(wèn)答(dá)翻(fān)译(yì)、内(nèi)容(róng)生(shēng)成(chéng)等(děng)日(rì)常(cháng)任(rèn)务(wu)的(de)需(xū)求(qiú)。DeepSeek-R1模(mó)型(xíng)专(zhuān)注(zhù)于(yú)复(fù)杂(zá)的(de)推(tuī)理(lǐ)任(rèn)务(wu),特(tè)别(bié)是(shì)在(zài)数(shù)学(xué)问(wèn)题(tí)、代(dài)码(mǎ)生(shēng)成、逻辑推理等领域具有更强的能力,但响应时间也相对较长。

DeepSeek为什么会受到如此大的关注?

DeepSeek-V3和DeepSeek-R1在春节前发布后,凭借其与OpenAI为首的顶尖大模型相当的性能以及低廉的训练成本和推理费用,迅速引发了全球的广泛关注。DeepSeek的高性价比挑战了美国大模型的垄断地位,它的推出使得更多企业和用户能够以更低的价格体验到最先进的AI成果。

DeepSeek开源了其技术细节和模型权重,使得更多人能够利用其成果进行创新和研发。与此同时,DeepSeek还免费开放了在线服务,吸引了大量用户体验,形成了前所未有的热潮。在DeepSeek-R1正式发布7天后,DeepSeek超越ChatGPT登上了AppStore免费应用下载排行榜的榜首。DeepSeek的成功标志着中国在AI领域的重大进展,提升了中国在全球AI技术竞争中的地位。目前,多个企业和高校已经开始自主部署DeepSeek模型,进一步证明了它的广泛应用潜力。

它为什么能用这么低的成本、这么有限的(de)算(suàn)法(fǎ)实(shí)现(xiàn)这(zhè)么(me)强(qiáng)大(dà)的(de)能(néng)力?是只在中文表(biǎo)达(dá)上(shàng)强大,还是各种性能都还不错?

DeepSeek能够以较低的训练成本实现强大的能(néng)力(lì),主要(yào)得(de)益(yì)于(yú)DeepSeek长(zhǎng)期(qī)以(yǐ)来(lái)在(zài)模(mó)型(xíng)架(jià)构(gòu)和(hé)算(suàn)法(fǎ)层(céng)面(miàn)的(de)持(chí)续(xù)创(chuàng)新(xīn)。

具(jù)体(tǐ)来(lái)说(shuō),DeepSeek通(tōng)过(guò)使(shǐ)用(yòng)混(hùn)合(hé)专家架构(MoE)和多头潜在注意力(MLA)等技术有效降低了推理成本。同时,借助数据蒸馏、分布式训练优化、以及硬件层面的精细调优,DeepSeek进一步提升了资源利用率,从而降低了训练成本。多种创新的优化技术的融合使得DeepSeek在仅拥有较低的训练和推理成本的同时,能够提供强大的性能。

在中文的理解和应用方面,DeepSeek有(yǒu)着突出的表现,它不仅能够理解古文,创作诗词,还能准确掌握时下流行的网络用语。而相比之下,ChatGPT的中文虽然语法通顺,却显得较为生硬。不过,DeepSeek的强大能力并不仅限于中文表达,在官方公布的多项标准评测中,DeepSeek在英文、百科知识、长文本、代码、数学能力等领域均达到了顶尖水平。

DeepSeek在不同领域的性能表现

(图(tú)片(piàn)来(lái)源(yuán):参(cān)考(kǎo)资(zī)料(liào)2)

在AI的范畴内,使用中文是否代表着更高的效率?

在AI领域,“效率”更高往往意味着处理速度更快,或者理解的准确性更高,或者生成的内容质量更好。

首先,中文和英文在结构上有很多不同。中文是表意文字,一个字可以表达很多意思,而英文是字母文字,每个单词由多个字母组成。中文相比英文在表达上更简洁、高效,信息密度更高。在表达相同的意思时,中文往往能更简洁地传达内容。因此在AI领域,使用中文可以提高表达效率,进而降低成本。

但同时,中文多样的语义和复杂的语法结构也对AI的理解能力提出了挑战。比如,在中文中,“花”可以是植物,也可以是花费,这可能让AI在理解上下文时更难。而英文虽然也有同义词和多义词的问题,但结构上可能更清晰一些。所以,处理中文的时候,AI需要更多的上下文信息来准确理解意思。

此外,数据量和模型的设计与优化也应当纳入考虑范围。如果AI模型在训练时使用了大量的中文数据,那么它可能在处理中文任务时表现更好。反过来,如果数据主要来自英文或者其他语言,那么AI在处理这些语言的时候效率可能会更高。某些模型可能是专门为某种语言而设计的,在这种情况下,在该语言上的效率自然就会更高。

关于中文在(zài)AI领(lǐng)域是(shì)否(fǒu)具(jù)有(yǒu)显(xiǎn)著(zhe)的(de)优(yōu)势(shì),目(mù)前(qián)尚(shàng)无(wú)定(dìng)论(lùn),未(wèi)来(lái)如(rú)何(hé)挖(wā)掘(jué)中(zhōng)文的(de)潜(qián)在(zài)优(yōu)势(shì)可(kě)能(néng)将(jiāng)成(chéng)为(wèi)重(zhòng)要(yào)的(de)研(yán)究(jiū)方向。

为什么在回答用户问题的时候,DeepSeek可以展示其“深度思考过程”?

DeepSeek-R1在回答用户问题时可以展示其深度思考过程是因为它使用了思维链(Chain of Thought, CoT)技术。思维链技术模仿人类的思考方式,它要求模型将复杂任务分解成简单步骤然后再逐步解决,从而增强模型在复杂推理任务中的能力。

OpenAI的o系列模型也使用了思(sī)维(wéi)链(liàn)技(jì)术(shù),但(dàn)OpenAI并(bìng)未向用户公开模型的原始思维链,而是仅提供了一个思维链的总结。而DeepSeek-R1作(zuò)为(wèi)开源模型,则完全开(kāi)放(fàng)了(le)思(sī)维(wéi)链(liàn),用(yòng)户(hù)可以清晰地看到模型在解决问题时的全部推理过程。

ChatGPT与DeepSeek分别有哪些特点?它们是(shì)否(fǒu)代(dài)表(biǎo)AI大(dà)模(mó)型(xíng)以(yǐ)后(hòu)的(de)两(liǎng)种(zhǒng)发(fā)展(zhǎn)方(fāng)向(xiàng),还(hái)是(shì)会(huì)融(róng)合(hé)发(fā)展(zhǎn)?

ChatGPT基(jī)于(yú)OpenAI的(de)GPT系(xì)列(liè)模(mó)型(xíng),使(shǐ)用(yòng)了(le)大(dà)量(liàng)多语言数据进行训练,支持多语言、多模态,能够跨语言和跨领域提供服务。作为闭源模型,它由OpenAI为用户提供在线服务。

DeepSeek则在中文领域进行了优化,拥有较低的训练和推理成本。DeepSeek是开源模型,用户可以根据需要自行部署并进行定制化修改。目前它们的技术架构和市场定位都有所不同,但随着技术的发展,未来可能会出现更多相互借鉴融合的趋势,例如DeepSeek可能会借鉴ChatGPT的多模态能力,ChatGPT也可能会优化其本地化服务以应对DeepSeek等竞争对手的挑战。

DeepSeek发(fā)布(bù)的(de)是(shì)开(kāi)源(yuán)模(mó)型(xíng),开(kāi)源(yuán)以(yǐ)后(hòu),后(hòu)面(miàn)应(yīng)当(dāng)如(rú)何(hé)保(bǎo)持(chí)领(lǐng)先(xiān)?

DeepSeek的(de)创(chuàng)始(shǐ)人(rén)梁(liáng)文锋(fēng)表(biǎo)示(shì),现(xiàn)在的生成式人工智能并不(bù)是(shì)终(zhōng)点(diǎn),未(wèi)来(lái)的(de)目(mù)标(biāo)是(shì)朝(cháo)着(zhe)实(shí)现(xiàn)通(tōng)用(yòng)人(rén)工智能迈进。在AI技术快速发展的当下,大家都没有碾压对手的技术优势,即使闭源也无(wú)法(fǎ)阻(zǔ)止(zhǐ)被(bèi)别(bié)人(rén)赶(gǎn)超(chāo)。为(wèi)了(le)应(yīng)对(duì)这(zhè)一(yī)挑(tiāo)战(zhàn),他(tā)们(men)希(xī)望(wàng)将(jiāng)价(jià)值(zhí)沉(chén)淀(diàn)在(zài)团(tuán)队(duì)的(de)成长之中,通过持续的创新来保持领先。开源的决策正是基于这一考量,开源可以打破技术垄断,降低技术门槛,激发更广泛的技术合作与创新。开源能够吸引更多的开发者共同参与贡献,构建一个开放与多元化的技术发展环境。DeepSeek希望通过这种方式推动技术的长远发展,保持领先地位,成为AI技术的引领者。

打开使用页面,有“深度思考(R1)”和“联网搜索”选项,二者在使用(yòng)上(shàng)有(yǒu)何(hé)区(qū)别?如何能更好地使用这种推理型大模型?

打开深度思考(R1)选项后,后台会切换到DeepSeek-R1模型,这个模型专注于需要复杂推理的场景,如数学或编程方面的问题。它能够展示详细的思维过程,提供推理步骤与最终结果。

联网搜索选项则允许模型获取实时互联网搜索的结果,适用于时效性较强、需要获取最新信息的问题,模型可以根据搜索结果提(tí)供(gōng)实(shí)时(shí)更(gèng)新(xīn)的(de)答(dá)案(àn)。

在(zài)使(shǐ)用(yòng)深(shēn)度(dù)思(sī)考(kǎo)(R1)功(gōng)能(néng)时(shí),在(zài)提(tí)问(wèn)中(zhōng)用(yòng)户(hù)无(wú)需(xū)额(é)外(wài)引(yǐn)导(dǎo)模型进行思考,只需要明确表达自己的需求,避免模糊不清的表述,以便模型更好地理解并提供准确的答案。在深度思考模式下,除了模型的最终答案外,用户还可以关注模型给出的思考过程,从而更好地掌握解决问题的详细方法。

哪些领域的工作受到DeepSeek的可能冲击最大,甚至能被取代?

DeepSeek等大语言模型可能会对那些依赖信息检索、数据分析、重复性高且目标明确的行业产生冲击。例如内容创作、数据处理、翻译校对、人工客服、人力资源管理和财务审计等领域,可能会被自动化的AI技术所替代。AI可以高效地完成用户(hù)需(xū)求(qiú)的任务,从而减少对人工的依赖。

然而,对于一些需要创造性、情感智力和人际沟通的工作来说,人工的参与仍(réng)然(rán)不(bù)可(kě)或(huò)缺(quē)。在(zài)AI技术飞速发(fā)展(zhǎn)的(de)当(dāng)下(xià),人(rén)们(men)需(xū)要(yào)不(bù)断(duàn)提(tí)升(shēng)这(zhè)些(xiē)难(nán)以(yǐ)被(bèi)AI轻(qīng)易(yì)替(tì)代(dài)的(de)能(néng)力(lì)。这(zhè)些(xiē)能(néng)力(lì)可(kě)以(yǐ)帮(bāng)助(zhù)个(gè)人(rén)在(zài)职(zhí)场(chǎng)中(zhōng)保(bǎo)持(chí)竞(jìng)争(zhēng)力(lì),确(què)保(bǎo)在(zài)未(wèi)来的工作环境中,人与AI能实现更好的协作和互补,共同推动社会进步。

AI发展的速度怎么这么快?会越来越快吗?

AI在过去几年中迅速发展,这得益于多个因素的推动。

首先,计算能力的大幅提升,尤其是GPU等硬件技术的发展,使得AI模型能够处理更大规模的数据,训练出更复杂的模型,从而提升了整体性能。

其次,互联网技术的飞速发展为AI训练提供了丰富的数据库。同(tóng)时(shí),深度学习领域算法架构的突破,也使得AI的能力不断增强。近年来,科技公司和投资者纷(fēn)纷(fēn)看(kàn)到(dào)了(le)AI的(de)潜力,并在资金和技术上给予了大力支持,这些因素共同促进了AI技术的飞跃发展。

虽然许多专家认为AI将在未来继续(xù)快速发展,但是否能够保持当前的速度仍然存在不确定性。乐观者认为,AI的进步将会呈(chéng)现(xiàn)指(zhǐ)数(shù)爆(bào)炸(zhà)的(de)趋(qū)势(shì),随(suí)着(zhe)AI智(zhì)能(néng)的(de)增(zēng)长(zhǎng),AI迭(dié)代的速度将会越来越快,最终完全超越人类。然而,算力和数据可能会成为制约AI技术发展的瓶颈,大型模型的训练需要越来越多的算力,而计算能力的发展目前已经不足以完全满足AI训练的需求。同时,人类现有的数据在未来几年内可能会被耗尽。

未来AI技术如何突破算力和数据的瓶颈,继续飞速发展,仍然需要全世界(jiè)科(kē)研(yán)人(rén)员(yuán)的(de)共(gòng)同(tóng)努(nǔ)力(lì)。此(cǐ)外(wài),AI可(kě)能(néng)引(yǐn)发(fā)的(de)伦(lún)理(lǐ)、法(fǎ)律(lǜ)与(yǔ)社(shè)会(huì)问(wèn)题(tí)也(yě)逐(zhú)渐(jiàn)引(yǐn)起(qǐ)了(le)人(rén)们(men)的(de)担(dān)忧(yōu),一(yī)些(xiē)科(kē)学(xué)家(jiā)已(yǐ)经(jīng)呼(hū)吁(xū)暂(zàn)停(tíng)开(kāi)发(fā)更(gèng)强(qiáng)大(dà)的(de)AI系(xì)统(tǒng),直(zhí)至(zhì)人(rén)们(men)可(kě)以(yǐ)确保其安全性和可控性。

参考(kǎo)资(zī)料(liào):

1.https://en.wikipedia.org/wiki/DeepSeek

2.https://api-docs.deepseek.com/zh-cn/news/news1226

3.https://api-docs.deepseek.com/zh-cn/news/news250120

4.Liu, A., Feng, B., Xue, B., Wang, B., Wu, B., Lu, C., ... & Piao, Y. (2024). Deepseek-v3 technical report. arXiv preprint arXiv:2412.19437.

5.Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). Deepseek-r1: Incentivizing reasoning capability in llms via reinforcement learning. arXiv preprint arXiv:2501.12948.

前一篇:未来农业的黑科技:绿色智能肥料如何让庄稼“吃饱不浪费”? 返回列表 下一篇:硅基生命终于来了!强AI将会成为人类文明的终结者吗?

相关新闻

中国“人造太阳”找到突破密度极限方法

2026-01-04

中国“人造太阳”找到突破密度极限方法

听歌时身体的一个小动作,揭穿了大脑的工作真相

2026-01-04

听歌时身体的一个小动作,揭穿了大脑的工作真相

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

2026-01-03

向章鱼“取经”,科学家3D打印出能抓蛋黄的水凝胶抓手

云平台应用案例

帮助企业低成本、高效率、专业化建立属于自己的工业互联网平台!

立即咨询