大模型还干不掉BI

360影视 国产动漫 2025-05-15 21:00 1

摘要:有服务商告诉我们,ChatGPT发布后的那个春节,不少客户打电话取消订单,甚至有客户好心建议他们改行。DeepSeekR1爆火后,许多企业IT团队纷纷套壳大模型自建应用。“二月份大家好像陷入了狂热,很多企业觉得自己可以靠DeepSeek颠覆一切。”数势科技联创

新一代BI如何突围?

文丨胡镤心

编辑丨张睿

当行业发展正面撞上技术变革,当你成为那个被平权、被颠覆、被当作靶子的对象时,你该做什么?这是不少SaaS公司在大模型时代的体会。

有服务商告诉我们,ChatGPT发布后的那个春节,不少客户打电话取消订单,甚至有客户好心建议他们改行。DeepSeekR1爆火后,许多企业IT团队纷纷套壳大模型自建应用。“二月份大家好像陷入了狂热,很多企业觉得自己可以靠DeepSeek颠覆一切。”数势科技联创谭李回顾。

这种冲击感在BI行业更为常见。“说起大模型颠覆,第一个想到的是数据库,第二个就是BI。”帆软FineChatBI产品负责人翁林君表示。

由于大模型在分析数据、处理数据上的优异表现,曾经作为企业数据“大脑”的BI,如今成了被平权的对象:从通过SQL、OLAP来分析数据,到通过图标拖拉拽来分析数据,再到通过自然语言对话来分析数据,BI的使用门槛直线降低。数据使用范式也随之改变:Agent将数据分析从被动调用变成实时推送,企业内部从“人找数”变成“数找人”。

BI(商业智能)行业也正在从传统的从“以报表为核心的IT响应”,到“以宽表为核心的自助可视化”,再到“以指标为核心的深度分析”转型。在产品架构、用户体验和业务逻辑的多重变革下,BI企业也在努力自救——预判大模型能力边界,加速融合AI能力,努力提升易用性和服务范围。

AI是否能跳过所有GUI和中间件环节,直接准确地调用数据库?自称Agent的BI应用,是现有流程的加强还是重构?手握know-how、数据且反应快速的老玩家和深谙大模型能力的新玩家同台竞技,谁能暂时领先?

01

“大模型去数仓里捞数,结果迷路了。”

DeepSeek发布那一周,谭李收到不止一个客户提出要自建ChatBI的电话,“有客户跟我说,他今天用了一个开源的ChatBI框架,现在DeepSeek大模型又开源可用,感觉我们的产品效果,他自己也能做出来。”

这类要求他不陌生,ChatGPT发布之后,自建系统的客户数一度高涨,还有企业在内部自研ChatBI,每三个月找他咨询一次技术难题。

谭李曾在百度与京东从事数据分析业务,早年也曾在咨询公司服务500强企业。在他的职业生涯中,ChatBI不是个陌生产品。

过去,企业调用数据的流程并不快捷,也很难实时——当管理者或业务人员使用数据时,需先把需求提给数据分析师,数据分析师把需求反馈给数据产品经理或数据工程师,数据工程师用SQL或者自动化工具调取数据,形成数据集后推送至BI可视化软件,分析师利用BI可视化软件配置各种形态的报表,呈现给业务人员和管理者。如此复杂的长流程,大多只能服务于企业管理层。

如今,大模型让这一复杂冗长的数据消费链路有了优化的可能。大模型的对话能力解决了BI调用难的问题,大模型的分析能力解决了BI数据报表多,指标散落难查找的问题。AI加持下的BI业务,从传统的定义业务——拆解数据分析思路——获取数据——数据加工——数据分析与可视化,直接简化为:上传数据——提出问题——获得分析结果。

也就是说,对于AI-Native的BI公司来说,企业的数据分析流程,从曾经的数据分析师、数据产品经理、数据工程师之间的接力,变成一个Agent搞定全过程。

图片来源:数势科技

但事实真能如此顺利吗?

过去两年实践中,不少企业发现,ChatBI在C端服务场景相对有效,因为数据量有限,容错率高,分析难度低。比如在教培行业,老师上传成绩单,AI自动分析,可以直接形成针对每个学生的成绩分析和学习建议。

但是在B端场景,尤其是高频使用BI的大型企业内部,由于业务体系庞大,多层级、多业务板块之间存在数据壁垒、统计口径混乱,大模型跨表查询准确率仅60%-70%,且企业内部存在自定义的算子、UDF等,大模型无法翻译,生成SQL存在缺失。

谭李分析道,“企业级数据分析,不是丢一个Excel或一本白皮书进去,就可以形成答案。”

首先,企业级数据的规模超出当下大模型产品索引的极限。标准的企业级场景,包含上千GB甚至PB数据,直接套壳大模型去做数据查询和加工,会导致响应延迟激增。

其次,大模型幻觉不仅出现在语义识别上,还出现在分析逻辑上。前者主要表现为字段歧义问题(如“销售额”在不同场景的定义差异),跨表关联、财务指标(如应收周转率)等复杂场景准确率骤降。后者表现在“9.11>9.9”等问题上,需人工修正。

更重要的是,企业级BI面临数据安全、数据权限等硬性要求。大模型无法确定提问人对企业数据的权限范围,直接to SQL容易出现数据安全风险。

“简单说,就是大模型去到任何一个企业级数仓里面捞数的时候,它迷路了。”谭李解释。

对于客户企业提出自建ChatBI的想法,谭李的回复通常都是:“那你先试试?”结果往往是,客户的技术团队还在努力,业务团队先受不了。“据我们观察,业务对技术的耐心一般也就半年到一年。时不时有客户的业务部门被技术折磨得不行了,直接找我们解决问题。”谭李总结。

面对ChatBI的折戟,谭李也一点不感到意外,“大家要对企业级产品充满敬畏之心,企业级产品真的很难,不是套个壳就行。”

02

BI新解法:给大模型建“路标”

对深耕数据分析行业的服务商来说,当下的AI赋能,还是在原有业务流程上的增强版。

从实践来看,过去两年,大模型给数据分析带来的增效主要体现在:

前端,通过大模型的意图理解能力,降低BI使用门槛——效果成熟。后端,基于大模型的生成能力,加强数据呈现与分析结果的可视化生成——效果良好。中间,通过大模型的推理能力,尝试生成指标与语义——今年新尝试。

大模型成为BI的交互入口,后端仍然是BI的计算引擎和权限体系。AI主要用于意图识别和条件判断,BI的规则引擎规范计算逻辑,BI的行列级权限控制,确保数据集自动过滤敏感字段(如身份证号、银行账户)。

比如在帆软的FineChatBI技术架构中,大模型处于“对话管理层”,用于支持对话引擎的意图分类、意图理解、思路拆解及上下文管理等能力。而FineChatBI的能力底座,依旧是数据连接、建模计算、搭建渲染、权限管理等BI需要具备的基础能力

图片来源:帆软

为了让大模型在数仓不迷路,过去两年,服务商们相继通过“指标平台”这一产品,将自然语言映射到预定义的业务逻辑,解决自然语言到SQL的准确度问题。

指标平台预设数据指标的定义与管理,避免业务理解对不齐,还具备权限管理能力,实现数据查询的安全可控。

图片来源:帆软指标体系框架

简言之,当下的数据分析路径是:NLP到指标、指标到SQL,SQL到数仓,数仓到数据明细表,由此实现自然语言到分析数据的全过程。

比如数势科技早在2020年就推出数据指标“管研用”一体化平台SwiftMetrics,通过0代码构建标准化的原子指标、派生指标和衍生指标,完成企业级数据-业务语义的统一。通过SwiftMetrics,业务人员不用学习SQL就能自助取数,同时统一指标口径,解决跨部门、跨系统指标口径混乱问题,或进一步推动企业从“数据消费”向“智能体协作”的范式跃迁。谭李强调:“我们做的并不是‘数据看板可视化’这类产品,而是数据智能,更注重DataAgent的应用及企业数据工作流范式的革新。”

2023年,网易有数也推出指标中台EasyMetrics,作为数据中台与业务应用之间的统一语义层,通过构建跨数据源的统一逻辑语义模型层,实现指标的标准化定义、开发与治理。EasyMetrics的构建与升级,构建了覆盖“定义-开发-治理-应用”全链路的指标体系,打破数据治理中“性能-灵活性-成本”的不可能三角,推动企业数据应用从“烟囱式开发”向标准化语义层转型。

尽管当下BI+AI还停留在对现有BI流程的扩展与增强中,厂商们也并不避讳基座模型升级带来的威胁——当前基座模型能力尚不足以解决NL2SQL的准确性,但基座模型的每一次升级,依然会带来被“偷家”的威胁。

BI公司不得不反复思考:如何让组织跟上技术发展,如何让产品能力随着大模型“水涨船高”。

网易数帆总经理封雷公开表示:“我们战略方向从原来的‘数据软件服务提供商’调整为‘做数据应用价值的赋能者。

封雷介绍,2024年,网易数帆开启“9个月变化”,产品层从数据治理走向数据赋能,加强数据指标制定、数据业务标注、底层数据血缘关联等等工作。在服务流程层,在原先产品交付的基础上,向前一步,加持业务经营。在组织架构上,具备既懂数据又懂业务的人才团队,甚至是面向前端多个不同的业务线,需要具备不同业务环节know-how能力的人才梯队。

谭李更是在产品构建伊始反复强调,产品规则和业务流程的搭建必须符合“水涨船高”的要求。数势科技通过原子化的产品架构,实现业务流程与大模型调用的灵活组合,这一产品思路背后是对模型能力边界的清楚预判。谭李认为,意图理解、规划复杂任务、生成报告与图标,都是模型擅长的,而定性分析是模型不擅长的,只能通过指标中台和企业级语义层来完成。“数据分析的天花板能冲多高,这是大模型决定的,我们要跟着大模型一起往上走。但兜底的活儿由我们来干,不能让大模型来兜底。”

03

Data Agent落地,BI能否拿到AI预算?

在企服行业的共识中,未来每个员工身边都会有一个Agent助理,Agent助理背后,则有成百上千个功能各异的Agent供调度,Data Agent是其中之一,负责数据分析职能。

个人Agent助理是B端的流量入口,也是当前企服公司必争之地,OA企业是这一入口级Agent的最强有力竞争者,BI公司也想成为最靠近员工的Agent。

今年正好成为Data Agent大规模落地元年。

以DeepSeek R1为代表的深度思考模型,将数据分析能力从分析师手中扩展到业务人员手中。

Agent这一产品形态的发展,则让BI能力从被动调用变成主动推送。“从人找数,变成数找人。这是我们说的新一代的智能分析范式。”谭李总结称,“今后的数据分析形态,会是在企业层面上面有一个超级数据智能体能够access到被企业授权的所有数据,包括结构化和非结构化数据,然后以个性化场景化的方式为企业每一个人员提供服务。”

比如霸王茶姬有数千家门店,以前每个店长要自己刷看板,分析经营状况,现在BI可以主动推送数据,在闭店后几分钟内,把当天的营业报告推给店长,同时告诉他对比去年同期、环比前一天表现如何,对比该商圈表现是怎样,别人比你好在哪,你比别人好在哪等等。

数势科技的SwiftAgent、帆软的FineChatBI,均以原子化的方式部署到阿里云等各大云平台上,成为Agent大军中的一员。而网易数科也将网易有数、网易云商等不同部门的Agent产品聚集在同一平台,为企业提供功能齐全的Agent协同服务。

相比于技术变革趋势,客户需求,尤其是客户的AI预算对企服公司来说更为致命。

过去三个月,亿邦动力接触不少品牌企业,热衷于探讨各种AI应用场景与落地方式,但一聊到预算环节,往往卡壳,话题戛然而止。

面对行业预算普遍不足的情况,找到early adopter(早期采用者)成为精细运营的核心。比如,寻找竞争性行业中的竞争性企业;比如寻找热衷于使用新技术栈的技术团队;再比如,寻找有互联网背景或者喜欢混迹于各类技术论坛的技术成员,这些early adopter企业中的early adopter部门和个人,都是BI公司的核心用户画像

可以看到,在复杂的B端场景,SaaS厂商不仅面临技术迭代、产品创新上的加速度,和AI Native创业者掰手腕,更面临着服务商之间的相互跨界和重新划分地盘。

竞争的焦点在于:谁率先跑通“AI+场景+数据”的链路闭环;谁先克服大模型幻觉,实现最后一公里的安全可控;谁能率先将企业服务从被动调用变成主动提供,从订阅付费变成结果付费。

起步阶段,BI公司基于行业Know-how与敏捷反应取得短暂领先,但随着模型升级与服务商相互攻伐,没有人可以稳坐高台。BI公司经历的这一变革,几乎是这个时代每个SaaS公司的缩影。

来源:亿邦动力

相关推荐