来源:派财经
2025-05-17 11:37:00
(原标题:2025OceanBase开发者大会:详解Data×AI战略,发布首个RAG产品)
升级AI战略后的OceanBase迎来了首次开发者大会。5月17日在OceanBase第三届开发者大会上,OceanBase发布面向AI的应用产品PowerRAG,该产品提供开箱即用的RAG应用开发能力,是OceanBase面向AI时代的探索之一。作为AI战略一号位、CTO杨传辉表示,OceanBase正致力于构建Data×AI能力,面向AI时代推动一体化数据库向一体化数据底座的战略演进。此前,CEO杨冰曾通过全员信宣布公司全面进入AI时代。
蚂蚁集团CTO何征宇在大会现场表示,蚂蚁集团将支持OceanBase在金融、医疗、生活等蚂蚁AI的核心场景的突破,支持OceanBase去实践DataxAI的理念和架构创新。同时继续支持OceanBase开源开放,把在Data×AI上的能力逐渐开放给行业,为AGI的梦想添砖加瓦。
从一体化数据库向一体化数据底座演进
AI时代带来了新的数据难题,已成为行业共识。IDC报告指出,受生成式AI等技术驱动,预计2028年全球新生成数据量规模将达到393.9ZB,其中企业数据规模和增速尤为凸显。于企业而言,数据仓库的容量已实现质的飞跃,结构化数据存储规模“突破PB级迈向EB级”成为新常态,这给数据存储、管理与分析带来严峻挑战。
蚂蚁集团CTO何征宇也在分享中指出,海量的互联网数据成就了今天的大模型,但大模型幻觉问题的源头也是数据问题。数据决定着大模型的能力上限,且依旧有四大挑战:一是数据的获取成本显著增加,二是严谨的行业数据稀缺且流动困难,三是多模态数据需要更强的处理能力,四是数据的质量评估难。
面对行业的真实需求,OceanBase正在大胆探索。杨传辉认为,作为一个一体化分布式数据库,OceanBase已经具备了一定的AI时代数据处理能力,如分布式有效应对海量数据的存储计算、多模融合统一处理不同结构数据、TP/AP一体化实现混合事务和实时分析处理。但大模型落地产生价值的核心在于数据与模型的一体化融合,这也是OceanBase提出的构建Data×AI能力的关键。
基于这一能力,OceanBase致力于从一个一体化数据库向一个一体化数据底座演进,通过一套引擎同时支持TP/AP/AI混合负载,支持向量数据库,实现SQL与AI的混合检索,这背后涉及OceanBase在Data与AI领域的工程与产品能力。
PowerRAG发布,提供开箱即用的RAG应用开发能力
在杨传辉描绘的一体化数据底座版图中,OceanBase期望在未来实现从算力、基础设施,到平台层、应用层、交付形态的全方位布局。
此次大会上,OceanBase首次发布面向AI的应用产品PowerRAG,打造AI驱动的开箱即用的RAG服务。
杨传辉介绍,传统RAG应用常用开发模式包括组件森林开发模式、RAG平台模式等,但存在开发周期长、维护成本高、灰箱调试困难、性能难以优化等问题。
OceanBase PowerRAG提供开箱即用的RAG应用开发能力,打通应用开发数据层、平台层、接口层与应用层的全流程,提供Document(文档)和 Chat(对话)两个核心API接口,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种AI应用场景的快速开发。
“致力于成为AI时代的一体化数据底座,PowerRAG是OceanBase在应用层面探索的第一步,未来还将在应用层面、平台层面不断突破。”杨传辉表示。
据了解,过去十五年OceanBase诞生于双11的海量交易场景并在蚂蚁集团的金融场景中经受磨砺打磨技术,未来,蚂蚁集团也将继续向OceanBase开放核心AI场景,帮助OceanBase进一步攻坚AI关键能力,实现开放开源,为行业提供更多的AI创新服务。
向量性能已达开源向量数据库业内的领先水平
作为原生分布式数据库,OceanBase原本就具有的企业级分布式数据库能力为AI时代的海量数据处理分析打下基础。在支持AI应用落地的核心基础设施——向量性能、混合检索等层面,OceanBase也在持续探索,进一步加强SQL+AI能力。
大会现场,基于基准测试工具VectorDBBench,采用Performamce768D1M测试数据集,OceanBase与业内三款领先的开源向量数据库进行性能跑分测试。结果显示,OceanBase的向量性能已经达到开源向量数据库业内的领先水平。
面对AI时代的海量数据,OceanBase还引入BQ量化算法(HNSW+BQ),大幅降低向量场景的内存需求;引入针对JSON半结构化数据的压缩能力,降低AI场景中的半结构化数据存储成本。根据测试结果,在同等召回率与性能的情况下,引入BQ量化算法能够实现内存成本较引入前降低 95%,而在TPC-H 10G数据集上,OceanBase的JSON压缩比可达 MongoDB 的3倍。
此外,OceanBase已具备面向多种数据模型的混合检索能力。在最新版本中,OceanBase混合检索性能进一步增强,通过丰富的执行策略、自研的向量算法库、内核级多模混合查询等实现更快、更准、更易用的混合检索。
目前,OceanBase已被客户应用于多个AI相关场景的开发,如联通软研院基于OceanBase打造AI助手,in银泰商业则基于OceanBase打造零售业智能问数平台等。
附:OceanBase CEO杨冰全员信
各位同学:
今年是OceanBase独立运营的第二年,也是OceanBase成立的第十五年。
回望过去一年,是OceanBase的关键一年。这一年在公司层面,我们成立董事会,正式独立运营;在商业化层面,我们实现了多个突破:我们坚定地将“专有云”和“公有云”作为发展双引擎,既抓住历史机遇攻坚金融政企市场,首批通过国测名单,夯实竞争优势,也加速推进云业务发展,成为云数据库领域的独立厂商第一,此外我们坚定迈向全球化,实现从0到1的组织升级,全面发力出海业务。
这一切成绩,都得益于过去十五年的厚积薄发。自2010年诞生以来,OceanBase从无到有,坚持100%根自研,毫无疑问已成为分布式数据库的标杆。我们坚信,海量数据的时代需要的是一款原生分布式数据库。OceanBase以攻坚者的姿态、开创者的精神,逐一攻克分布式数据库所遭遇的稳定性、安全性、高并发性、可扩展性、实时分析和多云等难题,打破世界纪录、经受真实场景考验,为市场提供了一款高质量的一体化分布式数据库产品。
此刻,我们面向未来思考,AI正在成为新的主题,它将重塑一切。谁能更好地解决DATA和AI的融合,实现“DATA×AI”,谁就能成为AI时代的数据底座。OceanBase专注数据处理,无论是我们追求卓越的技术文化,还是我们的分布式能力和一以贯之的“一体化”产品理念都与AI时代的需求不谋而合。OceanBase将全面进入AI时代,我们有信心打造出AI时代最好的数据底座,这是时代赋予我们的机遇和责任!
为全力保障AI战略的高效落地,经过管理层讨论,启动人才和组织体系升级,迎接AI新机遇。基于此决定:
· CTO杨传辉担任AI战略一号位,全面统筹AI战略制定和技术产品落地。
· 成立AI平台与应用部,由杨传辉Acting,ODC、OAS两个团队合并到AI平台与应用部,蔡飞志、王赫加入该团队,全力推进“DATA × AI”平台的搭建与应用开发,该团队将核心打造RAG、AI平台、知识库等能力。
· 在原有OB 底层引擎团队里,新成立AI引擎组,由席华锋负责,单海康、黄人煌加入该团队,聚焦打造AI推理引擎,元启继续向韩富晟汇报,原元启负责的系统组也直接向颜然汇报。
· 感谢蚂蚁集团的大力支持,接下来集团将开放全部AI场景给OB,助力OB打造AI时代的数据底座!
至此,我们将形成AI时代从一体化存储(行存、列存、KV、文档、向量、倒排)到一体化计算(OLTP、OLAP、NoSQL、向量数据库、搜索、推理、RAG)的全方位布局,依托蚂蚁的丰富应用场景将OceanBase的“DATA×AI”能力打磨成为新的核心竞争力,并逐渐服务外部客户,打造如分布式技术般的世界级AI数据底座。
近日举办的首届“OceanBase拥抱AI Campaign”收获了全员的热情参与,也涌现了各种创意,这是OceanBase这个团队创新能力的最有力证明,我们鼓励所有团队全面拥抱AI,积极储备人才,一起打造下一个十年的OceanBase!一起创造下一个伟大!
杨冰
OceanBase CEO
2025年4月27日
子弹财经
2025-05-17
智通财经
2025-05-17
智通财经
2025-05-17
子弹财经
2025-05-17
银柿财经
2025-05-17
和讯财经
2025-05-17
证券之星资讯
2025-05-17
证券之星资讯
2025-05-17
证券之星资讯
2025-05-17