来源:21世纪经济报道
媒体
2025-02-24 19:50:26
(原标题:重磅!DeepSeek:今天启动)
2月24日,DeepSeek启动“开源周”,开源了首个代码库FlashMLA。
DeepSeek称,这是DeepSeek针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,现在已经投入生产使用。“在H800上能实现3000GB/s的内存带宽以及580TFLOPS的计算性能。”DeepSeek表示。
据介绍,MLA(Multi-Layer Attention,多层注意力机制)是一种改进的注意力机制,旨在提高Transformer模型在处理长序列时的效率和性能。MLA通过多个头(head)的并行计算,让模型能够同时关注文本中不同位置和不同语义层面的信息,从而更全面、更深入地捕捉长距离依赖关系和复杂语义结构。
此前2月21日午间,DeepSeek在社交平台宣布,将连续开源5个项目的代码库,以完全透明的方式与全球开发者社区分享他们的研究进展,这一计划定义为“Open Source Week(开源周)”。DeepSeek表示,其在线服务中的构建模块已经被记录、部署并进行了实际测试,希望分享的每一行代码能加速行业发展进程。就在DeepSeek加码开源的同时,包括上海交通大学、深圳大学、浙江大学在内的多所高校本月都宣布开设DeepSeek课程。
民生证券计算机团队23日撰文指出,DeepSeek开源给予了云厂商低门槛部署世界级AI大模型机遇,而客户对于数据合规与部署便捷性需求,催生出DeepSeek一体机的蓝海市场。
已有超30家企业推出一体机
据民生证券计算团队梳理,天玑科技、深信服、海康威视、大华股份、浪潮信息、中国长城等30多家企业均推出了大模型一体机,其中以“DeepSeek”命名的约有近20家。
云从科技在接受南财快讯记者以投资者身份采访时表示,政务方面的一体机存在本地化部署的需求,但是客户订单信息无法透露。谈及账期是否较长时,该人员称,得看具体的约定,这与签订的合同有关。
DeepSeek作为第一梯队的免费开源模型,上线后访问量激增,成为目前最快突破3000万日活跃用户量的应用程序。需求井喷也造成了DeepSeek始终处于满负荷算力运行状态,官网API供应不稳定,用户使用过程中经常出现服务器繁忙导致无法回复用户问题的状况。第三方云服务厂商纷纷上线DeepSeek开源模型。但许多政企用户出于保护内部数据的考虑,往往不愿意使用公有云服务,私有化部署需求应运而生。
浙商证券指出,一体机“开箱即用”,是便捷、低门槛的私有化部署方案。还能够降低算力使用门槛,对于对数据安全要求较高的央国企、党政机关,一体机可以为其提供可靠省心的解决方案。
据了解,一体机是专为人工智能大模型应用和部署而设计的集成计算设备,本质上可以看作是AI服务器与大模型私有化部署的融合,通常包含中央处理器(CPU)、图形处理器(GPU)、存储器、操作系统、AI平台软件及各类模型算法等软硬组件。
根据浙商证券测算,预期DeepSeek快速部署需求有望带动一体机需求增长,2025年到2027年一体机需求量将分别将达到15、39、72万台,对应市场空间1236、2937、5208亿元。
2月24日,DeepSeek一体机概念发生异动,云从科技-UW盘中一度涨停,软通动力、科大讯飞、拓维信息等多股盘中走高,截至收盘均有回调。
(声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。)
本文综合自21财经客户端、南财快讯(记者:尹华禄)、上海证券报、证券时报、每日经济新闻
21世纪经济报道
2025-02-24
21世纪经济报道
2025-02-24
21世纪经济报道
2025-02-24
21世纪经济报道
2025-02-24
21世纪经济报道
2025-02-24
智通财经
2025-02-24
证券之星资讯
2025-02-24
证券之星资讯
2025-02-24
证券之星资讯
2025-02-24