乘云数字Databuff获评鑫智奖2025专家推荐TOP10优秀解决方案

360影视 国产动漫 2025-05-09 17:59 1

摘要:“鑫智奖”作为金融数据智能领域的重要奖项,已连续举办七届,致力于挖掘并推广金融科技与数据智能深度融合的优秀成果,彰显数据智能在金融场景中的落地成效和未来潜力。2025年评选活动共计收到来自70家企业的99个方案参评,经过27位专家评审与答辩打分,评选出专家推荐

为促进金融企业数据管理和数据平台智能化转型,金科创新社主办了“鑫智奖·第七届金融数据智能优秀解决方案评选”活动。其中,乘云数字DataBuff平台斩获 “专家推荐TOP10优秀解决方案” 奖项,彰显了乘云数字在金融科技领域的创新实力。

图:鑫智奖-专家推荐TOP10优秀解决方案

“鑫智奖”作为金融数据智能领域的重要奖项,已连续举办七届,致力于挖掘并推广金融科技与数据智能深度融合的优秀成果,彰显数据智能在金融场景中的落地成效和未来潜力。2025年评选活动共计收到来自70家企业的99个方案参评,经过27位专家评审与答辩打分,评选出专家推荐TOP10优秀解决方案。乘云数字此次获奖的“专家推荐TOP10优秀解决方案”,围绕国内银行新一代核心系统的复杂性面临的全新运行稳定性挑战,在快速的发现问题、定位问题、处理问题及大模型新技术的应用等方面展现出专业、系统的技术优势,获得专家组高度认可。

“通过DataBuff平台,实现全栈监控与诊断。利用预测性AI和因果性AI技术,提前发现异常并精准定位故障,大幅降低故障率和处理时间。同时,自研存储引擎有效降低成本并提升性能,助力降本增效。”

——吉林银行首席信息官邹帮山

“在数字化转型的推动下,银行等金融机构纷纷转向微服务、云原生技术体系,新一代核心系统面临系统交易链路复杂、业务连续性保障压力大、运维数据存储成本高等痛点。该方案融合因果性AI和生成式AI的预测和定位能力,提升故障定位的准确率和覆盖度;通过完全自研的时序与链路数据存储引擎,实现降本提效。有效解决基于云原生技术平台监控运维工作中的痛点。”

——国新国证基金首席信息官赵天智

一、解决方案概要

银行新一代核心的复杂性带来了全新的运行稳定性挑战,传统监控技术面临严重瓶颈。DataBuff一体化观测平台,通过创新的方式将“业务观测”、“因果AI”、“生成式AI” 三大领先技术深度融合,帮助银行全面解决新一代核心系统的运行稳定性问题。该平台能够深度感知新一代核心的业务运行状态,全面梳理消费者的业务旅程,构建“以业务为中心”的新一代监控管理体系,提供端到端的交易级链路追踪能力,快速发现问题、定位问题、处理问题,实现故障定位的一键直达。

二、银行新核心的特点和运维难点

随着新一代核心在银行业的广泛普及,业务系统的技术架构正在经历着新旧交替。IT 系统在系统架构、开发方式、部署方式、运行环境等方面经历了多次技术变革。系统架构方面,经历了从整体式、分层式、分布式到云原生的变化;开发方式方面,经历了从瀑布模式、螺旋模式、敏捷模式到DevOps 的变迁;部署方式方面,由物理机、虚拟机、容器化到 Serverless;运行环境方面,由自建机房、托管机房、私有云、公共云到混合云。新核心系统要应对高并发交易处理的压力,任何微小的故障都可能引发连锁反应,导致业务中断、客户流失,甚至损害银行的声誉。

新一代核心系统具备业务高并发处理系统弹性部署IT自主可控等特点,这也为运维部门带来了新的挑战。为保障该系统的稳定运行,需要满足极高的技术要求,具体表现在以下几个方面:

新核心系统交易链路复杂

经过微服务化的新核心系统服务调用链复杂,跨节点、跨集群问题难以追踪,故障排查依赖人工“逐层猜断”。 如信贷申请和审批业务流程复杂,会涉及多个服务协作,服务间通信频繁,故障排查具有很大难度。

业务连续性保障压力大

7×24小时在线服务要求故障分钟级响应。支付系统要求高可用性和低延迟,在高并发情况下可能面临资源争夺和响应时间延长等问题。

机器数据存储成本高、价值密度低

云原生场景下,日志、指标、链路等机器数据量大且分散,缺乏关联分析,无法快速支撑核心业务问题优化决策。运维数据噪音大,有效告警识别率低。

目前银行迫切需要一套拥有创新技术和独特优势的解决方案,方案须具备对新核心系统全维度的观测、智能化的诊断和多平台协同的能力,能够满足银行的新核心系统监控管理需求。银行迫切需要实现从“被动应对”到“主动预防”的转变,从而更高效地推动业务发展,满足未来更复杂的运营需求。

三、解决方案介绍

乘云数字 DataBuff 是一款业界领先的可观测性技术平台,采用业界最新水平的设计理念,只需在主机上安装一个Agent,即可实现所有软件堆栈的监控与诊断。其核心优势在于自动化和智能化,能够实时监控并分析复杂应用环境中的性能问题,快速定位故障根因。

部署架构主要包括:

OneAgent 一体化探针:自动部署在每台主机上,负责数据采集和传输;

DataHub 遥测数据管道:开放接入外部各种类型的监控工具,各种类型的监控数据,实现遥测数据的可视化编排治理;

OneCenter 一体化平台:云端或本地部署,负责数据处理、存储和分析。

图:解决方案整体能力架构

DataBuff 新核心业务观测与故障定位解决方案主要包括三个方面的功能:基于业务观测的用户旅程分析、基于因果AI的故障定位能力、基于生成式AI的运维自动化能力,以下展开详细说明:

3.1.基于业务观测的用户旅程分析

业务观测(Business Observability):面向银行核心交易系统的业务级、用户级旅程分析,通过整合技术性能数据与业务指标,帮助银行实现从“代码级故障定位” 到 “业务级影响评估” 的全链路洞察。其核心价值在于将系统可用性、交易效率等IT指标与客户体验、营收转化等业务目标深度关联,为技术运维与业务决策提供统一数据支撑。

图:业务地图

可观测性能力建设的一个关键性效益就是对业务支撑能力的提升。重点关注业务指标的提升是为保证企业在市场竞争中的领先地位,确保客户满意度和市场份额的增长,以及推动持续的业务改进和创新。领导者通过关注这些关键指标,能够有效地制定战略方向、作出数据驱动的决策,并激励团队实现共同的业务目标,从而确保企业的长期成功和可持续发展。在银行核心交易系统场景中,业务观测的主要功能包括:

1)业务KPI指标监控,动态追踪核心交易指标(如每秒交易量、成功率、响应时间),通过可视化仪表盘实时监控支付、清算等关键业务流状态,异常时触发告警(如交易量骤降50%),保障高并发场景下的业务连续性。

2)端到端交易链路透视,基于代码级全链路追踪,还原跨系统交易路径(如客户发起转账→风控校验→核心记账→清算系统),精准定位业务瓶颈(如风控规则引擎延迟或数据库锁争用),加速故障修复,避免交易积压。

3)转化率漏斗分析,分析业务流程中用户转化漏斗(如开户、贷款申请),识别关键环节流失原因。定位业务流程中的流失点(如实名认证步骤失败率超30%),优化身份验证逻辑。对比不同渠道(APP/网页)的转化率,指导资源倾斜与体验优化。

4)用户体验与业务关联分析,将用户行为(如手机银行APP支付失败率激增)与后端系统性能(如微服务超时、第三方接口异常)深度关联,识别客户流失的技术诱因(如身份验证服务响应慢),针对性优化业务流程。

3.2.基于因果AI的故障定位能力

因果AI(Causal AI):是通过构建动态因果关系拓扑,将银行核心交易系统中的上层异常(如交易延迟、失败)与底层根因(如代码缺陷、资源瓶颈)自动关联,实现无需人工干预的精准问题诊断。其核心逻辑是结合实时监控数据(指标、日志、拓扑)与历史模式,推理出故障传播路径,例如从数据库慢查询追溯到微服务调用链异常,并进一步评估对业务指标(如VIP客户交易成功率)的影响。

图:因果AI的类比图(人体系统的晕厥 vs IT系统的业务异常)

在银行新一代核心交易系统中,因果性CausalAI 故障推理准确率高。能够将通常的小时级问题排查降低到分钟级故障定位,实现1分钟发现问题、3分钟定位问题。能够自动识别和数字化映射新核心系统所在的整个IT环境,包括业务系统、服务、容器进程、基础设施等。通过三维空间拓扑,自动分析整个核心系统各个组件之间的交互依赖以及影响关系,结合核心系统故障场景知识图谱的AI推理能力,该方案精准定位影响核心系统业务性能的问题根源。

因果AI通过动态构建因果关系图谱,自动关联交易异常(如延迟、失败)与底层根因(如数据库锁竞争、微服务调用链超时、第三方接口故障),实现秒级精准定位问题。其功能涵盖:

1)智能根因诊断,无需人工排查即可追溯至代码方法或资源瓶颈(如CPU过载);

2)业务影响量化,评估交易中断对高价值业务(如大额转账、实时清算)的损失,优先修复关键节点;

3)预测性风险预警,基于历史数据预判交易洪峰(如月末结算)或容量瓶颈,触发扩容预案;

4)合规辅助,自动生成故障与业务指标的关联报告,满足金融监管对交易可追溯性及SLA合规审计的要求,保障系统高可用与业务连续性。

图:因果AI给出的故障定位结果展示

3.3.基于生成式AI的运维自动化效率提升

生成式AI(Generative AI) 是基于DeepSeek 大语言模型的运维智能辅助引擎,专注于将复杂技术数据转化为可操作的业务洞察,并自动化生成解决方案。在银行核心交易系统中,它通过自然语言交互与自动化能力,帮助技术、运维及业务团队快速理解系统问题并驱动决策,降低跨部门协作门槛。

图:基于DeepSeek的自然语言故障诊断

在银行新一代核心交易系统中,DataBuff 生成式AI基于自然语言交互与自进化能力,提供多维度智能支持:

自然语言查询:业务或运维人员可直接提问(如“为何大额转账延迟?”),无需专业语法即可获取根因分析;自然语言可视化:自动生成交易成功率趋势、链路拓扑等图表,直观呈现问题影响范围;自然语言诊断:将技术异常(如接口超时、风控规则拦截)转化为业务描述(例“支付失败因第三方认证超时”),降低跨团队沟通成本;自进化知识库:持续学习历史故障与处置方案,提升对新型问题(如云原生资源争用)的诊断准确性;自动化处置建议:结合上下文推荐修复动作(如调整数据库连接池、优化微服务超时配置),加速故障恢复。
通过上述能力,该AI驱动技术数据向业务决策的高效转化,保障核心交易高可用与合规性。

图:基于DeepSeek的指标异常问题分析

四、解决方案亮点

在银行新一代核心交易系统中,DataBuff 平台的核心亮点可概括为以下四方面:

4.1. 故障排查效率提升

通过全栈式代码级监控因果AI,实现分钟级根因定位,将平均故障修复时间(MTTR)从小时级缩短至分钟级,避免人工逐层排查的低效问题。

4.2. 业务转化率与用户体验优化

基于端到端用户旅程追踪,分析交易链路中高流失环节,针对性优化关键路径。同时,结合业务指标与性能数据,量化用户体验对营收的影响,推动转化率提升10%-20%。

4.3. 数据接入开放性

支持多源异构数据无缝集成,包括日志、指标、业务事件。通过DataHub 可视化编排灵活定义数据清洗、富化规则,将第三方系统数据统一纳入分析,打破数据孤岛,增强全局洞察力。

4.4. 高效数据库技术与降本增效

底层采用完全自研的时序数据库MoreDB与全量链路存储TracingX,实现海量交易数据(PB级)的高效存储与实时聚合查询,成本较传统关系型数据库降低50%+。同时,自动数据生命周期管理按策略归档非热数据,减少冗余存储开销,支撑高并发场景的稳定分析与审计回溯。

DataBuff 通过上述能力,为银行新核心系统提供从故障诊断、业务价值挖掘到资源优化的闭环支撑,成为数字化转型的核心引擎。此次获奖是对乘云数字在金融领域科技创新成果的肯定。未来,乘云数字将继续秉承创新驱动发展的理念,深化金融科技应用,推动数字化转型向更高水平迈进,为金融行业的数字化转型贡献力量。

来源:凯哥聊科技

相关推荐