来源:半导体行业观察
2025-02-25 09:26:44
(原标题:芯片设计上云,再迈关键一步)
近年来,随着5G、AI、物联网等新兴技术的兴起和快速发展,市场需求日益多元化,推动了芯片行业的转型升级,全球芯片市场迎来了前所未有的增长浪潮。
根据WSTS数据预测,2025年全球芯片市场规模将达到6972亿美元,市场潜力巨大。这不仅推动了全球市场扩张,也促使国内半导体行业加速技术革新,以应对更加复杂的市场需求和技术挑战。
尤其是伴随着去全球化趋势和半导体供应链重构,中国半导体业站在了时代变革的浪尖,以芯片设计为代表的细分领域在中国市场展现出强劲的增长势头。
中国半导体行业协会集成电路设计分会理事长魏少军教授表示,在全球半导体产业逐步复苏的背景下,2024年国内芯片设计行业销售额达到6460亿元,相比2023年增长11.9%,重新回到两位数的高速发展轨道;与此同时,2024年国内芯片设计企业数量增长至3626家,比2023年的3451家多了175家,行业韧性和潜力尽显。
在历经“国产替代”与“需求快速扩张”双频共振的超级周期后,在全球半导体产业的版图中,中国正以惊人的速度书写着属于自己的篇章。
在这个契机下,如何抓住半导体产业链重构的机会,成为了摆在国内数千家芯片设计企业面前的机遇与考验。
众所周知,芯片设计是整个半导体产业链的核心环节,直接影响着产品的性能和功能。然而,在当前市场背景和趋势下,该行业正迎来日益复杂的挑战。
一方面,随着芯片制程节点不断缩小,制造工艺的复杂性和成本不断增加;另一方面,大算力芯片、AI大模型快速发展,不仅显著提升了芯片设计所需的资源规模,也对资源的高效管理和优化利用提出了更高要求。在芯片设计环境愈发复杂的趋势下,大多数芯片设计企业缺乏专业管理工具和专业人员,同时还面临资源阶段性紧缺的挑战——企业在流片前需要大量算力做验证,本地资源很难满足。
对于芯片设计企业来说,这些挑战正在成为生死考验。
痛点之下,“上云”是制胜关键?
通常情况下,芯片的研发周期都比较紧张,尤其是大芯片,中后期经常是按天来做任务排期。而业内普遍采用的是自建数据中心,因为早期的芯片工艺没那么先进,对算力的需求也没那么大。
但随着工艺制程不断演进,芯片设计企业逐渐开始面临IT资源和效率无法满足业务需要的矛盾。
据业内人士透露,芯片项目在前期会做大量论证和规划,包括需要多少算力和存储。但问题在于,在项目推进过程中经常会有变更,包括制程的改进、功能变化及性能指标调整等。这种变更会造成大量突发的算力需求,如果通过采买或租借服务器的方式,从部署、上线测试,需要相当长的一段时间业务团队才能用上这些算力。比如一天之内要准备一两百台服务器,从确认服务器型号到采购,从安装服务器上机柜到机房运维,最快要8到12周,而且IT资金占用成本太高。
尤其是随着芯片设计行业进入到7nm甚至3nm时代,单颗芯片上的晶体管数量达到数百亿级,对算力的需求大幅增加。
这就意味着,如果继续采用传统模式,芯片设计企业在项目开发过程中将面临IT资产和环境的不确定风险。因此,在激烈的市场竞争和行业痛点下,做出适时有效的市场决策才是制胜的关键。
对此,“芯片设计上云”正在成为行业新的契机和发展趋势,将芯片的开发设计流程上云,可以减轻公司在人力、算力、软件和设计环境等方面的投入负担,提高资源利用率、降低研发成本、加快技术成果转化速度,优势显著。
作为全球三大公开市场5G芯片领导企业,紫光展锐积极拥抱“设计上云”趋势,早在2022年9月就携手同属新紫光集团旗下的紫光云,展开先行先试探索、启动了首个上云项目。
整个项目中,紫光展锐、紫光云依托新紫光集团的全产业链布局和内部平台的协同联动,基于对未来业务快速增长和传统IT模式局限性的综合考量,实现了芯片云平台的成功部署,丰富了IT资源配置手段,利用云计算的弹性算力解决项目波峰波谷的关键问题,再结合本地机房,实现了项目进度、IT资源和成本投入的最佳平衡。
具体来看,“设计上云”给紫光展锐带来了哪些好处?
1.
提升设计效率
加速后仿和signoff迭代:仿真任务的加速缩短了后仿和signoff(设计签核)的迭代周期,从而加快了整个芯片设计流程,确保TO(Tapeout流片)进度。
加速后仿和signoff迭代:仿真任务的加速缩短了后仿和signoff(设计签核)的迭代周期,从而加快了整个芯片设计流程,确保TO(Tapeout流片)进度。
2.
降低成本
优化资源配置:通过采购云资源,可以进行精确周到灵活的资源调整,按需定制占用资源的时间和数量,既能解决突发算力需求,又能避免本地采购在波谷的资源空转带来的浪费,提高资源利用率。
减少硬件采购:云计算按需付费模式,减少了对物理服务器的投入,降低了硬件成本,实现了IT资源和成本的最佳平衡。
作为新紫光集团旗下的核心企业,紫光展锐通过紫光芯片云在芯片设计过程中取得了诸多成果。
从当前产业动态不难看到,上云正在成为行业趋势。无论是中大型芯片设计企业还是中小规模公司,都在考虑将设计上云作为一个有效的解决方案,来应对芯片设计成本不断攀升、IT资源部署需求急剧上升、专业管理人员与能力缺乏的复杂挑战。
上云浪潮下,
紫光芯片云争做时代“弄潮儿”
实际上,在欧美地区,芯片设计上云已是共识。
相比国外,国内芯片设计上云的开端始于2019年左右,近年来随着云需求逐渐深化,云厂商积极往行业渗透,包括阿里云、腾讯云、紫光云等多家云平台相继开始探索高性能计算场景,打造客户实践案例。
其中值得关注的是,作为国内最早推动芯片设计云的行业实践者之一,紫光云早在2020年前后就开始围绕芯片设计云进行超前建设和部署。借助新紫光集团在芯片、服务器、云服务等领域多年的深厚积累和实践经验,以及从芯到云的新产业布局和能力输出,紫光芯片云已经成为了芯片设计上云领域的率先实践者和推动者。
2024年7月,新紫光集团完成品牌焕新,依托覆盖半导体及数字经济全产业链的战略布局,求新求变,加速发展。在此基础上,紫光云作为新紫光集团云服务板块的代表企业,凭借“云+数字化”双轮驱动模式,在技术上持续演进并深入场景应用。2024年12月,在上海集成电路产业发展论坛暨第三十届集成电路设计业展览会(ICCAD-Expo 2024)上,紫光云正式推出紫光芯片云3.0整体解决方案,该方案通过“四重服务升级”,旨在通过简化资源管理、提升资源分配的灵活性与响应速度,全面为芯片设计企业提速赋能。
第一重:上云咨询规划与保障服务
凭借紫光云深厚的行业经验和专业服务团队,根据芯片设计企业对环境的需求,为其提供覆盖从芯片设计环境的咨询规划到一站式集成交付的芯片设计完整解决方案,通过全面、专业的服务,帮助客户高效、安全地推进芯片设计项目。
从实践经验来看,有很多芯片团队在初创期匆匆启动研发项目,进入到迭代开发期之后开始遇到各种痛点和瓶颈,管理者们努力通过各种手段去弥补在初期就埋下的坑。然而,此时往往是牵一发而动全身,想要通过修修补补的方式去填坑,往往又会挖出新的坑。
因此,需要“兵马未动,粮草先行”的战略思维,通过紫光芯片云这样有经验和实力的团队来制定符合芯片公司的上云规划和服务,打通公司全方位的统一认知,建立一个高效、安全、长期发展的基础研发平台。
第二重:集群调度与管理服务
第二重服务聚焦于集群调度与管理,紫光云致力于提供芯片设计环境的核心解决方案,其中包括计算机辅助设计(CAD)管理平台和紫芯调度器两大关键产品。
如今,随着芯片设计复杂度不断增加,从单机设计转移到大规模集群化设计成为趋势。芯片设计企业面临最大的问题是环境越来越复杂,调优工作往往也难以顺利开展。
更为严峻的是,由于企业普遍缺乏专业的CAD管理人才、工具和IT资源部署等能力,导致难以建立起完善的CAD管理体系。对芯片设计企业来说如何把整个环境高效地管理和运维起来,是面临比较大的难题。
对此,紫光云深度洞察产业趋势,推出了专为芯片设计行业的IT/CAD运维管理量身定制的CAD管理平台,将整个底层资源计算包括网络、存储、安全统一纳入到该平台上,通过集群管理的可视化操作、深入的集群分析以及便捷的模板化配置,提高整体资源利用率30%以上。
此外,紫光云自研的紫芯调度器具备在数据中心和云环境中迅速搭建和维护异构高性能计算集群的能力,能够支持高达5万核规模集群管理,把整个芯片设计的业务灵活、高效地调度到各个节点进行高效稳定的运行,为用户提供业务所需的弹性资源和统一资源调度管理平台,有效提升资源利用率。
第三重,弹性算力支撑服务:公有云/私有云
具体选择怎样的上云方案,行业内并没有绝对的标准。
但目前通常会建两种类型的资源池:一个是在本地建常用的资源池,保障日常使用;然后涉及到弹性算力部分,因为在某些阶段会有大量的算力需求,此时利用公有云的弹性算力,按需付费,使用完了就释放,形成一种混合云模式。
另外,还有些公司已经在线下部署了部分硬件设备,上云也并不意味着将本地设备全部搬到云上,也可以通过局部上云,即将本地设备、资源作为一个常备算力进行储备,再辅以云上算力资源的弹性补充,两者协同或是一个更优的性价比方案。
紫光芯片云的第三重服务就是给客户提供全面的算力支持服务,一是可以为芯片设计企业提供灵活的私有云基础资源池,涵盖计算、存储、网络等核心基础设施;同时可以在公有云中提供包括基础资源、安全、虚拟桌面基础设施(VDI)、CAD在内的弹性资源池,全面满足企业对IT资源的弹性需求。
值得注意的是,在公有云上,紫光云的资源池较普通的公有云厂商更有特色。紫光芯片云解决方案总架构师耿加申表示,紫光云的公有云提供针对芯片行业的专有资源池,包括多核、高性能的裸金属产品、高性能存储、高标准的安全方案如监控、磁盘加密等,使得企业在选择资源的时候达到最优。
第四重:芯片设计服务
紫光芯片云还提供一站式芯片设计服务,从计算资源到设计流程,覆盖SoC设计、封装、集成、制造与测试等全产业链环节,只要客户提出设计需求,就能为芯片设计企业提供全方位的解决方案,满足多元化业务需求。
整体来看,经过四重服务,紫光芯片云3.0解决方案完成了从整个资源提供,包括芯片设计服务的完整解决方案能力。
耿加申表示:“紫光芯片云3.0解决方案中核心软件做到了全自研,并针对客户的需求持续迭代,通过一个平台把整个环境统一的可视化管理起来,提高运营效率,同时提供混合云服务、针对性的后端设计服务。这些升级服务可以帮助芯片设计企业快速提升设计效率,为芯片企业赋能。”
这一切优势背后,源于紫光云多年来在云计算和数字化领域的深耕细作。
据紫光云公司首席技术官柳义利介绍,在数字化板块紫光云有将近200个智慧城市的项目在中国深耕,长期服务政务、企业、金融和医疗行业,积累了很多行业纵向的一站式整合服务的能力。其中,芯片云是紫光云在企业领域重要的细分赛道。芯片云3.0整体解决方案的全新升级,是基于紫光云在云计算赛道的多年积累,在芯片场景的落地和价值变现。
平台好不好?用户最有发言权!
截至目前,紫光芯片云在设计上云领域已有了大量实践案例。
比较典型的服务是包括展锐在内的新紫光集团内部企业,这也是其打造芯片云方案的基础和摇篮。据耿加申介绍,紫光芯片云在推向市场前已在集团内部得到了充分验证,后续将标准化的芯片云方案,进而向行业客户进行推广部署。
在实际部署中,芯片设计企业最关心的问题是能不能把资源利用率提升起来?自身的资源利用率情况到底如何?只有了解这些之后才能更好的进行调整和优化。对此,紫光芯片云平台帮助客户在研发效率和资源管理方面取得了不错成果。以某企业部署CAD管理平台和紫芯调度器服务为例:
据了解,该企业在引入紫光芯片云服务前,面临着业务资源分散、资源利用率低下、项目保障低效、资源增购扩容无合理化依据等问题,其CPU使用率平均仅为40%,严重影响了研发流程的效率。
而借助紫光芯片云CAD管理平台,该企业实现了资源利用的最大化。通过整体集群管理可视化、集群分析专业化、配置模板化等功能,使得日均CPU使用率显著提升至超过80%,解决了资源利用率、快速部署和高效运营的问题。
另外,面对核心调度软件可能无法购买和获得技术服务的风险,采用紫光云自研紫芯调度器构建集群环境,在这个案例中管理的规模达到5万核的规模,每周的运行作业数量达到接近60万,且2年时间始终都在保持正常运行。
发展至今,紫光云已为50多家芯片设计公司提供了一站式芯片云服务。
另外,针对EDA、IP、PDK等芯片设计企业投入较大且大多数小微型企业没有太多议价能力的环节,借助紫光芯片云平台已有的生态合作伙伴,可以得到很好的支撑。紫光芯片云已联合了多家EDA和IP合作伙伴,通过跟芯片行业上下游产业链与工具厂商深度合作,共同构建全栈式服务,实现合作多赢。
正如紫光云系统部企业业务部部长陶豆所强调,云的本质就是生态。紫光云一直都在致力于构建一个完整的生态,从IaaS到PaaS,将完整的整体服务提供给芯片企业。
上云隐忧,何解?
芯片设计上云虽然带来了诸多好处,但极其考验云厂商的能力。例如芯片设计上云的安全性如何保障?企业哪些阶段适合上云/上云模式如何选择?用户使用习惯与兼容性?AI技术如何为上云赋能?...等等,都是当前芯片设计公司担忧和关心的焦点。
芯片设计上云,凭什么安全?
芯片设计企业最核心的是各种芯片代码和知识产权,相比其它行业,这个赛道对数据安全有着更高的要求。很多企业迟迟不上云,背后最大的隐忧就是安全性如何保障。
这也是紫光展锐考虑的首要问题。
展锐在上云时,选择了在芯片设计项目的TO前的后仿和signoff阶段上云。展锐表示,这个阶段时间集中在4-5个月,这两项工作的资源需求是项目IT资源需求的高峰期,一般一个中大型项目需要消耗公司1/4~1/5的IT资源。同时该阶段不使用RTL代码,已经转换为门级网表,既防范了安全性问题又解决了这2项工作高资源需求的挑战。
作为方案提供商,紫光芯片云在保障客户数据安全性方面同样做了很多工作。上文提到的紫光芯片云独立的专业资源池,能提供特殊的安全服务,包括监控、磁盘加密等一些业界领先的安全方案,还可以通过VPN专线等形式连接企业内部的网络通道,同时配合底层专用的算力以及核心软件的SaaS服务能力,可以基本保障芯片设计企业的安全顾虑。
另外一点需要强调的是,紫光芯片云支持的混合云计算架构,在保障客户数据安全方面具备天然优势。混合云允许企业将敏感数据和关键任务工作负载保留在本地或私有云中,由企业自己进行管理和保护,降低了数据泄露的风险。
企业上云,如何选?
安全顾虑之外,哪些阶段适合上云,以及上云模式如何选择也是芯片设计企业关注的重点。
从目前来看,上云服务分两大块,一个是本地资源池,称为私有云;另外一块是弹性算力,公有云。耿加申表示,不同类型和规模的企业对上云的阶段和选择是不一样的。
如果是中小芯片设计企业,因为涉及到上云的时候要重新搭建一套新的环境和工具,建议一开始就用公有云方式来做,打造安全、高效和成本优势;而对于已在线下部署了部分硬件设备或本地资源池的企业,考虑到阶段性高算力需求以及缺乏专业人才和集群管理、调度等复杂挑战,倾向于将后端设计局部上云,将本地资源作为常备算力进行储备,辅以云上算力资源进行弹性补充,打造一个更有性价比的方案。
对比完全本地采购,该方式可以使用最新的服务器和存储,显著地提升效率;同时能解决突发需求,避免本地采购在波谷的资源空转。公司需要根据全年项目情况,在本地采购和云资源上找到最佳平衡点。
“我建议在公司业务规模不大或尚未变大之前,尽快选用云模式来完成初期的环境搭建,由云服务商提供设计环境的管理运营,用户不用关心资源的搭建,可以将全部精力聚焦在自身业务上,我认为这是最优的。” 耿加申补充道。
总之,针对不同客户的不同需求,紫光芯片云能够提供私有云、公有云以及混合云资源池,为芯片设计企业提供完整的解决方案。
LSF一家独大,供应风险如何破局?
从行业现状来看,过去20多年来,行业内绝大多数的本地计算集群都优选采用IBM公司的LSF进行作业调度和集群管理,IC工程师也习惯了用LSF来提交作业。
这导致了在芯片设计集群核心软件这一领域,LSF一家独大,面临潜在供应风险。
对此,紫光云自研的紫芯调度器针对芯片设计仿真场景优化,兼容LSF用户使用习惯,支持大规模的管理和调度,高效地使用资源,实现了调度软件的国产化。同时,紫光芯片云的CAD管理平台也可以兼容市面上的主流调度软件,可以统一进行管理和支持。
AI赋能,芯片设计上云加速度
另一方面,AI与云服务融合不断加深。
此次紫光芯片云3.0的特点之一就是使用了先进的AI加持工具,帮助芯片设计企业快速提升芯片设计效率,提高芯片生产的质量和可靠性。
据柳义利介绍,紫光芯片云通过紫芯调度器+AI技术来加速作业调度和设计服务,包括前端的作业调度和后端布局布线都会用到AI的算法和技术,这是紫光芯片云正在开始落地实践的两个非常明确的场景,以提升调度的效率和准确性。
综合来看,紫光芯片云通过精细化管理、优化LSF调度、保障数据安全等一系列措施,成功打造了一个高效、可靠、安全的云端设计环境。
与此同时,作为新紫光集团战略规划的重要组成部分,紫光芯片云将继续与各界通力合作,继续推动行业技术创新,通过领先的市场洞察能力和技术实力,打造多方共赢的产业生态体系,帮助客户抓住半导体行业中的新兴机会,为半导体产业发展注入新活力。
紫光芯片云,抢得先机
当前,全球半导体正处于一个技术创新与市场机遇并存的时代。
从芯片制程的进步到高性能应用的兴起,再到5G、AI等新兴技术的推动,半导体产业的未来充满了无限可能。随着技术进步和市场需求的变化,芯片设计上云已成为行业发展的重要趋势。
紫光芯片云作为产业新格局下的有力竞争者,展现了如何通过云技术优化资源配置、提高设计效率的可行路径,为芯片设计企业提供在“上云”这一关键领域中的长期发展蓝图,推动半导体产业技术创新与市场扩展,提升整体产业链的竞争力。
中国半导体行业协会预测,2030年全球半导体市场规模有望增长到1万亿美元,再次迎来新一轮增长浪潮。而那些能够紧抓趋势、精准布局的企业,无疑将在这场新的科技浪潮中占得先机。
随着云计算战略价值在全球范围内持续提升,拥有规模和先发优势的紫光芯片云,正在掌握主动权。
紫光芯片云联系人:
李泽笙:18210585625
张俊辉:15958359459
半导体精品公众号推荐
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4046期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦
半导体行业观察
2025-02-25
半导体行业观察
2025-02-25
半导体行业观察
2025-02-25
半导体行业观察
2025-02-25
半导体行业观察
2025-02-25
半导体行业观察
2025-02-25
证券之星资讯
2025-02-25
证券之星资讯
2025-02-25
证券之星资讯
2025-02-25