大模型还干不掉BI

摘要：有服务商告诉我们，ChatGPT发布后的那个春节，不少客户打电话取消订单，甚至有客户好心建议他们改行。DeepSeekR1爆火后，许多企业IT团队纷纷套壳大模型自建应用。“二月份大家好像陷入了狂热，很多企业觉得自己可以靠DeepSeek颠覆一切。”数势科技联创

新一代BI如何突围？

文丨胡镤心

编辑丨张睿

当行业发展正面撞上技术变革，当你成为那个被平权、被颠覆、被当作靶子的对象时，你该做什么？这是不少SaaS公司在大模型时代的体会。

有服务商告诉我们，ChatGPT发布后的那个春节，不少客户打电话取消订单，甚至有客户好心建议他们改行。DeepSeekR1爆火后，许多企业IT团队纷纷套壳大模型自建应用。“二月份大家好像陷入了狂热，很多企业觉得自己可以靠DeepSeek颠覆一切。”数势科技联创谭李回顾。

这种冲击感在BI行业更为常见。“说起大模型颠覆，第一个想到的是数据库，第二个就是BI。”帆软FineChatBI产品负责人翁林君表示。

由于大模型在分析数据、处理数据上的优异表现，曾经作为企业数据“大脑”的BI，如今成了被平权的对象：从通过SQL、OLAP来分析数据，到通过图标拖拉拽来分析数据，再到通过自然语言对话来分析数据，BI的使用门槛直线降低。数据使用范式也随之改变：Agent将数据分析从被动调用变成实时推送，企业内部从“人找数”变成“数找人”。

BI（商业智能）行业也正在从传统的从“以报表为核心的IT响应”，到“以宽表为核心的自助可视化”，再到“以指标为核心的深度分析”转型。在产品架构、用户体验和业务逻辑的多重变革下，BI企业也在努力自救——预判大模型能力边界，加速融合AI能力，努力提升易用性和服务范围。

AI是否能跳过所有GUI和中间件环节，直接准确地调用数据库？自称Agent的BI应用，是现有流程的加强还是重构？手握know-how、数据且反应快速的老玩家和深谙大模型能力的新玩家同台竞技，谁能暂时领先？

“大模型去数仓里捞数，结果迷路了。”

DeepSeek发布那一周，谭李收到不止一个客户提出要自建ChatBI的电话，“有客户跟我说，他今天用了一个开源的ChatBI框架，现在DeepSeek大模型又开源可用，感觉我们的产品效果，他自己也能做出来。”

这类要求他不陌生，ChatGPT发布之后，自建系统的客户数一度高涨，还有企业在内部自研ChatBI，每三个月找他咨询一次技术难题。

谭李曾在百度与京东从事数据分析业务，早年也曾在咨询公司服务500强企业。在他的职业生涯中，ChatBI不是个陌生产品。

过去，企业调用数据的流程并不快捷，也很难实时——当管理者或业务人员使用数据时，需先把需求提给数据分析师，数据分析师把需求反馈给数据产品经理或数据工程师，数据工程师用SQL或者自动化工具调取数据，形成数据集后推送至BI可视化软件，分析师利用BI可视化软件配置各种形态的报表，呈现给业务人员和管理者。如此复杂的长流程，大多只能服务于企业管理层。

如今，大模型让这一复杂冗长的数据消费链路有了优化的可能。大模型的对话能力解决了BI调用难的问题，大模型的分析能力解决了BI数据报表多，指标散落难查找的问题。AI加持下的BI业务，从传统的定义业务——拆解数据分析思路——获取数据——数据加工——数据分析与可视化，直接简化为：上传数据——提出问题——获得分析结果。

也就是说，对于AI-Native的BI公司来说，企业的数据分析流程，从曾经的数据分析师、数据产品经理、数据工程师之间的接力，变成一个Agent搞定全过程。

图片来源：数势科技

但事实真能如此顺利吗？

过去两年实践中，不少企业发现，ChatBI在C端服务场景相对有效，因为数据量有限，容错率高，分析难度低。比如在教培行业，老师上传成绩单，AI自动分析，可以直接形成针对每个学生的成绩分析和学习建议。

但是在B端场景，尤其是高频使用BI的大型企业内部，由于业务体系庞大，多层级、多业务板块之间存在数据壁垒、统计口径混乱，大模型跨表查询准确率仅60%-70%，且企业内部存在自定义的算子、UDF等，大模型无法翻译，生成SQL存在缺失。

谭李分析道，“企业级数据分析，不是丢一个Excel或一本白皮书进去，就可以形成答案。”

首先，企业级数据的规模超出当下大模型产品索引的极限。标准的企业级场景，包含上千GB甚至PB数据，直接套壳大模型去做数据查询和加工，会导致响应延迟激增。

其次，大模型幻觉不仅出现在语义识别上，还出现在分析逻辑上。前者主要表现为字段歧义问题（如“销售额”在不同场景的定义差异），跨表关联、财务指标（如应收周转率）等复杂场景准确率骤降。后者表现在“9.11>9.9”等问题上，需人工修正。

更重要的是，企业级BI面临数据安全、数据权限等硬性要求。大模型无法确定提问人对企业数据的权限范围，直接to SQL容易出现数据安全风险。

“简单说，就是大模型去到任何一个企业级数仓里面捞数的时候，它迷路了。”谭李解释。

对于客户企业提出自建ChatBI的想法，谭李的回复通常都是：“那你先试试？”结果往往是，客户的技术团队还在努力，业务团队先受不了。“据我们观察，业务对技术的耐心一般也就半年到一年。时不时有客户的业务部门被技术折磨得不行了，直接找我们解决问题。”谭李总结。

面对ChatBI的折戟，谭李也一点不感到意外，“大家要对企业级产品充满敬畏之心，企业级产品真的很难，不是套个壳就行。”

BI新解法：给大模型建“路标”

对深耕数据分析行业的服务商来说，当下的AI赋能，还是在原有业务流程上的增强版。

从实践来看，过去两年，大模型给数据分析带来的增效主要体现在：

前端，通过大模型的意图理解能力，降低BI使用门槛——效果成熟。后端，基于大模型的生成能力，加强数据呈现与分析结果的可视化生成——效果良好。中间，通过大模型的推理能力，尝试生成指标与语义——今年新尝试。

大模型成为BI的交互入口，后端仍然是BI的计算引擎和权限体系。AI主要用于意图识别和条件判断，BI的规则引擎规范计算逻辑，BI的行列级权限控制，确保数据集自动过滤敏感字段（如身份证号、银行账户）。

比如在帆软的FineChatBI技术架构中，大模型处于“对话管理层”，用于支持对话引擎的意图分类、意图理解、思路拆解及上下文管理等能力。而FineChatBI的能力底座，依旧是数据连接、建模计算、搭建渲染、权限管理等BI需要具备的基础能力。

图片来源：帆软

为了让大模型在数仓不迷路，过去两年，服务商们相继通过“指标平台”这一产品，将自然语言映射到预定义的业务逻辑，解决自然语言到SQL的准确度问题。

指标平台预设数据指标的定义与管理，避免业务理解对不齐，还具备权限管理能力，实现数据查询的安全可控。

图片来源：帆软指标体系框架

简言之，当下的数据分析路径是：NLP到指标、指标到SQL，SQL到数仓，数仓到数据明细表，由此实现自然语言到分析数据的全过程。

比如数势科技早在2020年就推出数据指标“管研用”一体化平台SwiftMetrics，通过0代码构建标准化的原子指标、派生指标和衍生指标，完成企业级数据-业务语义的统一。通过SwiftMetrics，业务人员不用学习SQL就能自助取数，同时统一指标口径，解决跨部门、跨系统指标口径混乱问题，或进一步推动企业从“数据消费”向“智能体协作”的范式跃迁。谭李强调：“我们做的并不是‘数据看板可视化’这类产品，而是数据智能，更注重DataAgent的应用及企业数据工作流范式的革新。”

2023年，网易有数也推出指标中台EasyMetrics，作为数据中台与业务应用之间的统一语义层，通过构建跨数据源的统一逻辑语义模型层，实现指标的标准化定义、开发与治理。EasyMetrics的构建与升级，构建了覆盖“定义-开发-治理-应用”全链路的指标体系，打破数据治理中“性能-灵活性-成本”的不可能三角，推动企业数据应用从“烟囱式开发”向标准化语义层转型。

尽管当下BI+AI还停留在对现有BI流程的扩展与增强中，厂商们也并不避讳基座模型升级带来的威胁——当前基座模型能力尚不足以解决NL2SQL的准确性，但基座模型的每一次升级，依然会带来被“偷家”的威胁。

BI公司不得不反复思考：如何让组织跟上技术发展，如何让产品能力随着大模型“水涨船高”。

网易数帆总经理封雷公开表示：“我们战略方向从原来的‘数据软件服务提供商’调整为‘做数据应用价值的赋能者。”

封雷介绍，2024年，网易数帆开启“9个月变化”，产品层从数据治理走向数据赋能，加强数据指标制定、数据业务标注、底层数据血缘关联等等工作。在服务流程层，在原先产品交付的基础上，向前一步，加持业务经营。在组织架构上，具备既懂数据又懂业务的人才团队，甚至是面向前端多个不同的业务线，需要具备不同业务环节know-how能力的人才梯队。

谭李更是在产品构建伊始反复强调，产品规则和业务流程的搭建必须符合“水涨船高”的要求。数势科技通过原子化的产品架构，实现业务流程与大模型调用的灵活组合，这一产品思路背后是对模型能力边界的清楚预判。谭李认为，意图理解、规划复杂任务、生成报告与图标，都是模型擅长的，而定性分析是模型不擅长的，只能通过指标中台和企业级语义层来完成。“数据分析的天花板能冲多高，这是大模型决定的，我们要跟着大模型一起往上走。但兜底的活儿由我们来干，不能让大模型来兜底。”

Data Agent落地，BI能否拿到AI预算？

在企服行业的共识中，未来每个员工身边都会有一个Agent助理，Agent助理背后，则有成百上千个功能各异的Agent供调度，Data Agent是其中之一，负责数据分析职能。

个人Agent助理是B端的流量入口，也是当前企服公司必争之地，OA企业是这一入口级Agent的最强有力竞争者，BI公司也想成为最靠近员工的Agent。

今年正好成为Data Agent大规模落地元年。

以DeepSeek R1为代表的深度思考模型，将数据分析能力从分析师手中扩展到业务人员手中。

Agent这一产品形态的发展，则让BI能力从被动调用变成主动推送。“从人找数，变成数找人。这是我们说的新一代的智能分析范式。”谭李总结称，“今后的数据分析形态，会是在企业层面上面有一个超级数据智能体能够access到被企业授权的所有数据，包括结构化和非结构化数据，然后以个性化场景化的方式为企业每一个人员提供服务。”

比如霸王茶姬有数千家门店，以前每个店长要自己刷看板，分析经营状况，现在BI可以主动推送数据，在闭店后几分钟内，把当天的营业报告推给店长，同时告诉他对比去年同期、环比前一天表现如何，对比该商圈表现是怎样，别人比你好在哪，你比别人好在哪等等。

数势科技的SwiftAgent、帆软的FineChatBI，均以原子化的方式部署到阿里云等各大云平台上，成为Agent大军中的一员。而网易数科也将网易有数、网易云商等不同部门的Agent产品聚集在同一平台，为企业提供功能齐全的Agent协同服务。

相比于技术变革趋势，客户需求，尤其是客户的AI预算对企服公司来说更为致命。

过去三个月，亿邦动力接触不少品牌企业，热衷于探讨各种AI应用场景与落地方式，但一聊到预算环节，往往卡壳，话题戛然而止。

面对行业预算普遍不足的情况，找到early adopter（早期采用者）成为精细运营的核心。比如，寻找竞争性行业中的竞争性企业；比如寻找热衷于使用新技术栈的技术团队；再比如，寻找有互联网背景或者喜欢混迹于各类技术论坛的技术成员，这些early adopter企业中的early adopter部门和个人，都是BI公司的核心用户画像。

可以看到，在复杂的B端场景，SaaS厂商不仅面临技术迭代、产品创新上的加速度，和AI Native创业者掰手腕，更面临着服务商之间的相互跨界和重新划分地盘。

竞争的焦点在于：谁率先跑通“AI+场景+数据”的链路闭环；谁先克服大模型幻觉，实现最后一公里的安全可控；谁能率先将企业服务从被动调用变成主动提供，从订阅付费变成结果付费。

起步阶段，BI公司基于行业Know-how与敏捷反应取得短暂领先，但随着模型升级与服务商相互攻伐，没有人可以稳坐高台。BI公司经历的这一变革，几乎是这个时代每个SaaS公司的缩影。

来源：亿邦动力

标签：模型 agent sql 谭李语义层

本文地址：https://news.43u.com.cn/a/1595170.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!