|

财经

江小涓:中国要在AI大模型的竞争中迎头赶上 补齐数据短板迫在眉睫

来源:21世纪经济报道

2024-05-23 19:32:51

(原标题:江小涓:中国要在AI大模型的竞争中迎头赶上 补齐数据短板迫在眉睫)

21世纪经济报道记者 王俊 实习生 王睿芝 北京报道

如何推进中国数字经济健康发展,更好发挥新动能角色,如何推动建立高效的特色创新机制是各界关注的课题。近日,中国工业经济学会会长、中国社会科学院大学教授江小涓分享了自己的观点。

数据是江小涓一直强调的重点。她认为,创新与发展围绕数据展开。“数智时代,数据成为重要的创新要素。数据的广度和深度支撑着新的工具方法和思维方式,赋予我们通过数据对世界进行洞察和理解的能力。”

数字平台作为海量数据的生产者、汇聚者和聚合挖掘者,在创新链条中的地位大大提升,位势不断增强。

不过,目前中国数据存在共公开数据开放共享不足等问题。江小涓指出,中国要在AI大模型的竞争中迎头赶上,补齐数据短板迫在眉睫。社会各领域的数据要推动开放利用。从政府角度看,要尽快强力推动政府数据和公有企事业单位的数据开放。

大型数字企业凭借数据优势在创新链条地位大大提升

长期以来,科技成果向产业应用的转化问题是一个突出问题。2022年,国家知识产权局发布的《中国专利调查报告》显示,我国有效发明专利产业化率为36.7%,其中,高校发明专利产业化率为3.9%,科研单位发明专利产业化率为 3.3%,企业发明专利产业化率为48.1%。

江小涓认为,大型数字企业是产学研一体化创新的核心点,数据能力可以支撑大型数字企业产学研一体化创新。

她指出,大型数字企业生产和汇聚海量数据,能准确感知市场需求和应用场景。同时大型平台有能力大规模投入,组建研发簇群,研发内容可以覆盖产业生态所需的全链全域技术体系,并直接用于自身庞大生态圈。这种模式下创新、产业和用户一体化,可以解决“科技成果转换”问题。

并且,数据能力支撑大型数字企业从事前沿技术创新。大型数字企业具有巨量链接和海量数据获取、处理与迭代能力,是数字前沿技术的重要创新力量。在自动驾驶、云计算、渲染引擎、虚拟现实等前沿数字技术领域,国内发明专利企业占比超80%,国际发明专利排名前20位的均为企业,明显高出一些典型的传统领域,大型数字企业走向创新前沿。

数据能力还可以支撑大型数字企业从事基础研究,积极探索从0-1的原始创新。

此外,数据能力还可以支撑大型数字企业投资新创企业。江小涓指出,平台拥有海量多元和异构数据,对数字相关领域创新方向高度敏感,同时具有较强投资能力。2021年中国独角兽排名前100的企业中,62.39%独角兽企业获得来自大型数字科技企业的投资,在A轮和B轮获得数字科技企业投资比例为47.86%。 “和传统创投资金财务投资特征明显的情形相比,数字企业创投资金具有更明显的战略投资者特征。”她表示。

数据和场景需求影响创新组织演进。在数智技术研发中,数据和应用场景愈多愈好,成为支撑创新的重要能力。并推动着创新主体和创新组织的不断变化,开源开放也是产业发展内在诉求。

发挥制度优势以最大力度开放公共数据 为数智产业发展提供关键要素 

当下,人工智能时代到来。大模型作为新的生产力范式,已经在各行各业中展现出不可替代的价值。

江小涓指出,从全球产业发展来看,美国OpenAl、Google等公司已经建立一定领先优势,除前沿算法研发先发优势和高性能算力供给充足外,更源自于它们在大规模训练数据搜集、处理和利用上的积累。

她认为,中国要在AI大模型的竞争中迎头赶上,补齐数据短板迫在眉睫。社会各领域的数据要推动开放利用。从政府角度看,要尽快强力推动政府数据和公有企事业单位的数据开放。

在她看来,开放公共数据意义重大。公共数据可作为我国发挥产业优势和制度优势、增加数据供给的关键抓手。公共数据包括了政府部门和公共企事业单位产生的数据。由于公共部门的绝对和相对规模大,我国公共数据相对体量大。 

有研究表明,我国政府部门掌握的数据资源占据全社会数据资源总量的50%-80%左右。但开放共享不够,数据利用效率不够高。

我国政府数据开放发展至今,发展和应用最好的主要还是地理位置信息的开放、公共设施的数据开放(图书馆、教育机构、公共wifi等)、涉及健康安全的数据开放(比如河流洪水水位、交通拥堵状况、空气指数等)、市场监管数据开放(企业信息查询、行政处罚查询等)。“不过这些信息现已可以通过多种途径获得。我国公共数据开放共享还有很大空间。”她表示。

江小涓提到,要发挥制度优势以最大力度开放公共数据,与其它各类数据汇聚融通,为数智产业发展提供关键要素。

数据优势企业不能只为自己“数据增强”,还要为更多企业赋能

企业是这轮人工智能革命的创新领先者。

江小涓指出,人工智能大模型发展需要快速汇聚海量资源和工程化技术能力,大模型场景化应用落地需要细颗粒度专业知识,因此在这一轮发展中产业界地位更加重要,要引导支持人才等各类资源向企业汇聚。 

研究显示,从2002年到2014年,学术界在开发最先进的AI系统方面处于领先地位。2014年后,由于尖端人工智能研究需要大量的数据和计算资源,这使得只有少数大科技企业具备开发和应用大模型的能力。到2022年,32个重要的机器学习模型都诞生在产业界,学术界仅有3个。

“大模型的训练和调整需要极其巨大的数据、算力和算法的投入,只有大科技企业雄厚的财力才足以吸引大批顶尖AI人才,从而以算力、算法和数据的最佳组合推动人工智能前沿的创新突破。”她表示。

国际经验表明,政府之外,大量数据集中在头部企业,特别是金融、能源、通讯、交通、医疗等行业。不过,江小涓表示,这些行业倾向于数据自用增强自身业务,这种方式对非数据密集型企业特别是新创企业不够友好。 

她指出,数据优势企业不能只为自己“数据增强”,还要为更多企业“数据使能”。数据原生产业是由数据支撑的创新企业,各国都很重视其发展,鼓励和要求持有数据的大企业将数据释放出来,使数据赋能更多创新行为。

 

证券之星资讯

2024-06-17

证券之星资讯

2024-06-17

首页 股票 财经 基金 导航