OceanBase发布首个RAG产品,剑指AI时代数据底座优势在哪?

360影视 欧美动漫 2025-05-17 14:39 2

摘要:5月17日,分布式数据库OceanBase发布首个面向AI的应用产品PowerRAG。这是继4月OceanBase宣布全面进入AI时代,不到1个月之内的最新动作。

最新消息,5月17日,分布式数据库OceanBase发布首个面向AI的应用产品PowerRAG。这是继4月OceanBase宣布全面进入AI时代,不到1个月之内的最新动作。

作为国内最成熟的分布式数据库,OceanBase此时押注AI,甚至直接表达了“做AI时代数据底座”的野心,他底气到底从哪里来?

从一体化数据库向一体化数据底座演进

AI时代带来新的数据难题,已经成为了行业共识。

IDC的报告指出,受生成式AI等技术驱动,预计2028年全球新生成数据量规模将达到393.9ZB。对于企业而言,结构化数据存储规模“突破PB级迈向EB级”成为一种新常态。同时,与数据量级相伴而来的,还有数据复杂度,这给数据存储、管理与分析带来严峻挑战。

而这也给OceanBase带来了机会。


公开信息显示,在 OceanBase 过去14年产品技术演进中,一体化的理念从架构设计的第一天就被视为自然而然的选择,OceanBase通过分布式架构底座将多个关键能力融合到一个引擎和一套数据库。

经过14年的发展,到了今天AI的浪潮中,OceanBase天然地具备了一定的AI时代数据处理能力,比如分布式有效应对海量数据的存储计算、多模融合统一处理不同结构数据、TP/AP一体化实现混合事务和实时分析处理。

而在支持AI应用落地的核心基础设施——向量性能、混合检索等层面,OceanBase也交出了一份漂亮的答卷。

核心的向量性能已经达到业内领先水平

大会现场,基于基准测试工具VectorDBBench,采用Performamce768D1M测试数据集,OceanBase与业内三款领先的开源向量数据库进行性能跑分测试。

结果显示,OceanBase的向量性能已经达到开源向量数据库业内的领先水平。


针对AI时代的海量数据,OceanBase还引入BQ量化算法(HNSW+BQ),大幅降低向量场景的内存需求;引入针对JSON半结构化数据的压缩能力,降低AI场景中的半结构化数据存储成本。

根据测试结果,在同等召回率与性能的情况下,引入BQ量化算法能够实现内存成本较引入前降低 95%,而在TPC-H 10G数据集上,OceanBase的JSON压缩比可达 MongoDB 的3倍。

此外,OceanBase已具备面向多种数据模型的混合检索能力。通过丰富的执行策略、自研的向量算法库、内核级多模混合查询等实现更快、更准、更易用的混合检索。

首个RAG产品,提供开箱即用RAG能力

除了向量能力的提升,此次大会上,OceanBase首次发布了面向AI的应用产品PowerRAG,打造AI驱动的开箱即用的RAG服务。

据了解,PowerRAG能够打通应用开发数据层、平台层、接口层与应用层的全流程,提供Document(文档)和 Chat(对话)两个核心API接口,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种AI应用场景的快速开发。

而这也是OceanBase未来全方位布局中的重要一环。杨传辉表示:“PowerRAG是OceanBase探索的第一步,未来还将在应用层面、平台层面不断突破。”


过去15年,OceanBase诞生的双11海量交易场景,创造了中国基础软件领域的诸多奇迹,而进入攻坚AI的周期,还有更多期待的空间。

也许20年后,中国真的能走出一个世界级的AI数据底座!

来源:白呀白Talk一点号

相关推荐