|

财经

周鸿祎谈DeepSeek:开启AI产业的“iPhone”时刻

来源:经济观察报

媒体

2025-02-08 21:08:34

(原标题:周鸿祎谈DeepSeek:开启AI产业的“iPhone”时刻)

春节前后全球最热门的话题非DeepSeek莫属。

DeepSeek的全称为杭州深度求索人工智能基础技术研究有限公司,由幻方量化基金的联合创始人梁文峰于2023年7月创立,一直专注于大语言模型(LLM)及其相关技术的深度研发。

公开信息显示,DeepSeek于2025年1月20日正式发布R1模型,并同步开源了模型权重。由于该模型的性能比肩OpenAI o1正式版,所以备受用户青睐:1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

“横空出世”的DeepSeek迅速成为全球讨论的焦点,上至硅谷AI巨头,下至A股小散户,均热烈参与了该话题的讨论,而中美股市相关股票亦因此出现剧烈波动。

在2024年的全国两会上,全国政协委员、360集团创始人兼董事长周鸿祎便提出了“通用大模型的发展将是国运之争”的提案。那么,现在他又如何看待这次的“DeepSeek现象”?2025年2月7日,经济观察网就此采访了周鸿祎。 

DeepSeek崛起的真正意义

经济观察网:最近,DeepSeek“横扫”科技圈,成为全球最热门的话题。你认为,DeepSeek的技术创新与颠覆性究竟体现在哪里呢?

周鸿祎:今年春节期间,DeepSeek凭借极低的训练推理成本和超高性能,以及彻底开源的R1模型,在短短的一周内横扫全球,迅速登顶模型下载排行榜和应用下载排行榜第一名。大量的用户在试用DeepSeek之后,被其实际效果惊艳,并纷纷搭建起自己的DeepSeek优化模型部署,引发了市场对大模型高资本投入模式的质疑,以及对人工智能行业发展路径的思考。

就技术而言,DeepSeek表现出了两点优势。第一,颠覆了推理认知的技术革命,让AI从鹦鹉学舌进化到自主思考。与传统大模型填鸭式的死记硬背的监督学习不一样,DeepSeek通过强化学习的方式让AI真正开启了认知革命,在推理上获得了极大进步,开创了人工智能的新方向。

第二,强化学习策略使得人工智能大模型无效训练降低了60%,对高强度计算算力的需求下降了40%。据了解,DeepSeek-R1的推理成本仅为OpenAI o1成本的3%到5%,实现了性能与成本的双重突破,极大地扩展了高性能模型的可普及性,降低了使用门槛,使得更多应用能快速负担并整合大模型能力,甚至很多C端用户也可以在电脑和手机上直接使用高性能的大模型,大幅度扩展应用场景。

这意味着,中国正在用更聪明的算法打破大模型发展路径上堆积显卡竞赛的魔咒,就像当年两弹一星工程用手工计算出了原子弹的公式一样,今天我们用数学智慧化解了芯片算力的围剿。

经济观察网:随着DeepSeek的火爆出圈,有人将其称之为“国运级别”的科技成果。对此,你怎么看?

周鸿祎:DeepSeek引起了全球轰动,使得我们看到了一个走向AGI(通用人工智能)的新的技术方向,中国迎来了属于自己的高光时刻。我觉得不要仅仅把目光停留在DeepSeek的技术突破上,它更是给整个人工智能产业带来了“iPhone时刻”,并对AGI发展带来了巨大推动。实际上,这才是中国在AI领域真正实现创新和自信的标志。

从开源到低成本开发,从技术普及到科技平权,再到行业引领,DeepSeek的成功让全世界看到了中国人工智能技术从追赶到比肩的历史性跨越。它的意义不仅仅在于中国人工智能公司对OpenAI等美国一线大模型公司的一次技术超越,更证明了中国用自己的智慧和独特的路径开创了影响全球的技术范式。这也标志着大模型真正迎来了大规模商用的技术拐点。

我一直坚信,只有把大模型拉下神坛,让大模型能力从“原子弹”变成“茶叶蛋”,才能真正进入百行千业和千家万户,进而引发大模型的工业革命。此次DeepSeek的创新,不仅验证了Transformer(一种基于自注意力机制的神经网络架构,主要用于处理和生成文本数据)加上强化学习路线的有效性,通过开源模式打破了头部模型的技术封闭,降低了技术门槛,同时也拆解掉了大模型公司所依赖的资本优势,大幅度加速了大模型商业化的发展速度,让更多的企业和开发者能够以负担得起的价格用上顶尖模型。

可以说,DeepSeek-R1最大的贡献就是重新教育了企业用户和老百姓,让大家认识到大模型真的可以用了,大模型行业也从一种探索阶段进入了创新阶段,成为了AI产业的“iPhone”时刻。 

争议焦点:模型蒸馏与开源技术

经济观察网:在DeepSeek火爆全球之时,市场上也存在一些不同的声音。近日有知名研究团队更是声称,通过蒸馏法以极低成本训练出了可以媲美DeepSeek-R1的模型。请问,何为蒸馏?你如何看待蒸馏行为?

周鸿祎:模型蒸馏是人工智能训练中普遍采用的一种方法,就是把大语言模型中的能力和知识迁移到更小模型的技术,目的在于构造资源高效和性能优异的小模型。

蒸馏就像是教学,打个比喻,老师为了快速提高学生成绩,将毕生所学的题目整理成册让学生学习,里面不仅有题目和答案,还有老师的做题思路和备选解题方法。所以学生在学习时不仅可以学会题目和答案,还可以学会老师的解题思路,能够在此基础上举一反三,这个过程就叫做蒸馏。所以蒸馏并不是偷窃数据,更像人工智能之间的教学和互相学习,美国做大模型也会用蒸馏技术来加强自己模型的能力。

OpenAI声称DeepSeek偷窃了其思维链数据是一个谎言。众所周知,OpenAI o1是一个强推理模型,作为一个闭源公司,OpenAI的推理过程不对外输出。这也是为什么DeepSeek要走出一套自己的方法,在不需要任何人工数据的情况下,完全靠机器自己的强化学习拥有了强大的思维能力,在人工智能上趟出一条新路。所以在思维链能力方面,DeepSeek走的技术路线和OpenAI完全不一样,谈不上去蒸馏OpenAI的数据。  

经济观察网:由于闭源模型的性能往往优于开源模型,所以OpenAI等巨头均采用闭源模式,但这次DeepSeek却通过开源模式给业界带来了巨大的震撼。在你看来,此次DeepSeek的“开源革命”,能否引发AI巨头对商业模式的重新考量?

周鸿祎长期以来,开源模型一直在追赶闭源模型,但总是差一点火候。然而这一次DeepSeek作为开源模型赶上了所有的闭源模型,一下就将企业和个人的需求创造出来了。所以大模型行业竞争的焦点,很快就从如何造模型转向了如何高效用模型,势必会开启一场广泛的应用创新浪潮。

此次DeepSeek-R1不仅开放了所有的权重参数,还公开了详尽的技术报告,相当于DeepSeek把自己的知识分享给了整个人工智能产业和全人类,不仅开源模型使用,而且鼓励全球开发者的社区共同参与贡献代码和数据。目前在大模型生态社区,Hugging Face平台上已经有几百个基于DeepSeek派生出来的衍生模型,这些由世界各地开发的模型正在适应各种特定场景的探索需求,这也是开源的魅力。

可以说,DeepSeek彻底践行了开源精神,与OpenAI等走向闭源的公司形成鲜明对比。OpenAI虽然创立初衷很美好,却在商业化浪潮中背离初心,而DeepSeek坚守技术共享,让全球开发者受益,吸引众多开发者投身其开源生态,有望重塑全球AI产业格局,使AI发展重心向开源转移,迈向普惠、平等的新阶段。

呼吁:抛弃门户之见、共同支持DeepSeek

经济观察网:开源模型由于其开放性和可扩展性,似乎面临着更多的安全威胁,实际上,近期DeepSeek也频频受到网络攻击。在你看来,站在安全的角度来看,该如何解决开源模型的这个痛点?

周鸿祎:随着AI深度融入生活,技术的稳定性和韧性将会成为关键要素。去年发生的微软蓝屏事件证明了如果所有的互联网数据都必须通过某一家公司的数据中心,一旦这家数据中心的服务中断必将导致全球停摆。如果AI普及之后,影响还将进一步放大,从家庭机器人到智能网联车,当AI全面渗透线上线下生活时,人们对技术服务的依赖将急剧加深,任何服务的中断都会变得难以忍受。因此,构建深度的技术安全韧性,将成为避免未来人类社会瘫痪的最佳方案。在构建AI深度融入社会的数字未来时,开源技术就成了我们实现安全转型的最重要资产。

开源的优势不仅在于分摊训练成本,还可以自己调制可控性、所有权和隐私保护。当AI深度嵌入社会时,开源的根本价值将体现在系统韧性上,这也是实现算力分布式部署本地化运行的最有效途径。当每个人在家里都能部署起自己能跑大模型硬件的时候,就构成了一个巨大的算力的分布网络,甚至每个节点上都可以跑着一台本地化的、不同应用方向的大模型。

前不久DeepSeek的线上服务遭受了IP地址来自美国的大规模DDOS攻击,这反映了美国对DeepSeek崛起的担忧,并试图通过多种手段限制其发展。美国之所以针对DeepSeek祭出一系列强硬手段,并非仅因为DeepSeek技术领先、导致美股波动,以及冲击OpenAI业务等因素,更是因为其开源系统能力强大,远超OpenAI等在美国占据主流的闭源系统,此举或将动摇美国的人工智能基础设施。一旦美国的开发人员、技术人员和公司都开始大规模选择使用DeepSeek开源系统,那么整个AI的发展重心就会转移到以DeepSeek为核心的生态建设上。

在这个历史时刻,我呼吁国内的同行应当“抛弃门户之见”,共同支持DeepSeek。对此,360也推出了一系列相应的支持措施。一方面,我们愿无偿为DeepSeek提供全方位安全保护。同时,360推出的纳米AI搜索不仅可以使用DeepSeek模型,还专门接入高速专线,集成了DeepSeek蒸馏的快速模型,同时上线“满血版DeepSeek模型”,一起为用户提供最好的AI体验。


fund

证券之星资讯

2025-02-08

证券之星资讯

2025-02-08

证券之星资讯

2025-02-08

首页 股票 财经 基金 导航