鲲鹏计算正式发布鲲鹏RAG解决方案1.0

360影视 欧美动漫 2025-05-26 22:10 1

摘要:2025年5月23日-24日,鲲鹏昇腾开发者大会2025(KADC 2025)在北京中关村国际创新中心盛大开幕。在23日上午举行的鲲鹏开发者峰会上,鲲鹏计算正式发布鲲鹏RAG解决方案1.0。此外,北京宝兰德软件股份有限公司、北京东方通科技股份有限公司、江苏润和

2025年5月23日-24日,鲲鹏昇腾开发者大会2025(KADC 2025)在北京中关村国际创新中心盛大开幕。在23日上午举行的鲲鹏开发者峰会上,鲲鹏计算正式发布鲲鹏RAG解决方案1.0。此外,北京宝兰德软件股份有限公司、北京东方通科技股份有限公司、江苏润和软件股份有限公司、软通动力信息技术(集团)股份有限公司、深圳市长亮科技股份有限公司和卫宁健康科技集团股份有限公司基于鲲鹏RAG解决方案1.0打造各自行业的差异化RAG解决方案。

AI浪潮涌动
企业级RAG解决方案应运而生

当前,以DeepSeek为代表的大模型创新正以前所未有的速度推动着人工智能的边界,带动了应用创新的集中涌现。生成式AI技术被广泛应用于企业业务流程中,日均Token消耗量已从千亿级跃升至十万亿级。然而,在将大模型应用于企业实际业务场景时,如何确保生成内容的准确性、时效性,并安全地利用企业私域数据,成为摆在众多企业面前的挑战。传统的AI应用面临着模型幻觉、数据隐私泄露以及部署复杂、成本高等痛点。

在此背景下,检索增强生成(RAG)技术应运而生,它通过在生成过程中引入外部知识检索,有效缓解了大模型的“幻觉”问题,大幅提升了生成内容的准确性和相关性,并能更好地利用企业内部的专有知识。然而,如何高效、安全、低成本地构建和部署RAG系统,成为企业数智化转型深水区的破局关键。鲲鹏RAG解决方案1.0的推出,正是为解决这些痛点而设计。

鲲鹏RAG解决方案1.0
技术标杆,特性卓越

鲲鹏RAG解决方案是基于鲲鹏CPU和昇腾NPU、第三方GPU卡,打造包含RAG业务编排、AI+微服务、部署调度、安全和存储的开源开放体系,定义企业级RAG的技术标杆。

在部署效率方面,该方案深度适配Dify、RAGflow等主流开源平台,提供鲲鹏原生容器镜像,开发者可一键拉取、分钟级部署,极大简化了RAG系统的搭建流程。资源调度层基于Kubernetes(K8S)与Ray构建,实现一键自动化安装,确保RAG方案即开即用。

在核心能力方面,鲲鹏RAG解决方案提供文档处理、向量数据库、模型服务等全面的AI+微服务。其中,向量数据库支持openGauss、Milvus等主流选择,为高效知识检索奠定基础。秉持“松耦合、易演进”的设计理念,RAG服务与大模型可分离部署,支持独立升级,确保了系统的高度灵活性和可维护性。

尤为重要的是,鲲鹏RAG解决方案1.0在数据安全方面提供了纵深防御能力。基于鲲鹏特有的virtCCA和PCIPC机密计算能力,构建了CPU+xPU安全隔离的可信执行环境,实现了机密AI和机密RAG,从根本上保护了AI模型和RAG私域知识在运行时的安全,为客户的核心资产提供了坚如磐石的防护。

携手伙伴,深度落地千行百业

会上,来自北京宝兰德软件股份有限公司、北京东方通科技股份有限公司、江苏润和软件股份有限公司、软通动力信息技术(集团)股份有限公司、深圳市长亮科技股份有限公司和卫宁健康科技集团股份有限公司基于鲲鹏RAG解决方案1.0打造各自行业的差异化RAG解决方案。

当前鲲鹏RAG解决方案已经预集成到各企业的产品体系中,覆盖金融、医疗、运营商、数字政府等多个关键领域。例如,长亮科技基于鲲鹏RAG方案在金融行业打造智能风控AI整体解决方案;浩鲸科技则联合鲲鹏与openGauss,打造了运营商高性能智能体解决方案;卫宁健康也在医疗行业积极探索RAG应用;东方通推出鲲鹏RAG解决方案,为企业提供开箱即用的智能化解决方案。这些实践案例充分证明了鲲鹏RAG解决方案在实际业务场景中的卓越性能与广泛适用性。据了解,该方案目前已被行业70多家ISV伙伴预集成,并天然支持多种开源组件及云上、线下不同部署方式,显示出强大的市场潜力和兼容性。华为计算内部也已基于鲲鹏RAG解决方案打造了智能问答助手,大幅提升了办公效率,率先验证了其核心价值。

此次鲲鹏RAG解决方案1.0的发布,是鲲鹏在打造AI时代先进算力底座进程中的关键一步,作为AI应用创新的重要引擎,为千行百业的智能化升级提供坚实的算力底座和技术支持。

来源:华为计算

相关推荐