摘要:在庞大而复杂的广告流量中,风险线索往往稀疏、隐蔽。传统手段在效率、效果与可控性上日益受限。「阿里妈妈-风控团队」希望构建一套更智能的分析机制,让大模型像刑侦专家一样抽丝剥茧、自证其言。为此,我们引入深度研究(Deep Research)范式,以「领域图约束」为
在庞大而复杂的广告流量中,风险线索往往稀疏、隐蔽。传统手段在效率、效果与可控性上日益受限。「阿里妈妈-风控团队」希望构建一套更智能的分析机制,让 大模型 像刑侦专家一样抽丝剥茧、自证其言。为此,我们引入 深度研究(Deep Research)范式,以「领域图约束」为大模型装上“导航仪”,引导其有序探索、理性判断,在千亿级流量中锁定风险根因。如果你对这样的挑战感兴趣,欢迎加入我们,共建可解释、负责任的风控智能!
为了直观地理解,我们首先以“广告主投诉处理”为例,演示其核心流程与关键特性。
在广告投放过程中,商家如发现异常扣费,通常会发起投诉。此时,风控团队需根据商品 ID 与异常时间段,排查所有相关流量,判断是否存在作弊行为。一旦确认作弊,需发起赔付,将对应金额返还商家。
观察左上角对话框,可将整个流程拆解为四个关键步骤:
1)需求理解与流程规划:模型解析用户输入,结合风控「领域图约束」,制定分析路径。
2)工具选型与调用:接入 DNA 反作弊平台,选择并加载对应分析工具。
3)分析执行与过程持久化:按规划执行分析,所有中间结果均持久化,支持断点续跑与交互调试。
4)报告输出与业务闭环:汇总分析结果,生成结构化报告,支持一键返款和结果归档。
阿里妈妈是阿里巴巴集团旗下的商业数字营销平台,依托集团核心的商业数据和超级媒体矩阵,每年为数百万广告主提供总额逾千亿元的广告服务。作为国内头部广告平台之一,阿里妈妈掌握着价值数千亿的商业流量,也因此成为黑灰产持续觊觎的重要目标。为了守护平台生态,风控团队持续为阿里妈妈、闲鱼、飞猪、优酷、Lazada 等多个业务提供支撑,覆盖站内与站外的多类媒体,保障数十条产品线的业务安全。
24 年 11 月,我们分享了 新一代阿里妈妈反作弊平台(Deepstring oN Alimama Defense Force,DNA)的核心算法框架 DeepString。本篇内容将介绍团队近期基于大模型进行端到端决策的一些探索。
传统风控系统,高度依赖领域专家对风险的抽象。然而在高精度、有限精力约束下,专家往往难以对“上下文稀疏”的流量,给出置信的判断。黑灰产正是利用了这一盲区:随着对抗手段不断演化,攻击模式升级为多资源协同的分布式作弊,行为被巧妙地掩藏于稀疏但看似正常的流量之中。此外,过分依赖专家经验,还存在培养成本高、效率有限、效果不稳定、可控性不足等问题。这些瓶颈直接制约了我们向自动化决策的迈进。
专家制约
近年来,GPT、Claude、Qwen 等通用大模型的飞跃式发展,尤其在知识泛用性、多模态理解、Prompt 驱动推理等方面的能力,正在突破传统机器学习应用的边界。让我们第一次看到,有可能在风控场景中,摆脱对领域专家的重度依赖,构建“无监督探索”的分析系统。但是大模型想要在严肃生产环境中端到端决策,做到 每一次推理都“可解释(Reasonable)且负责任(Responsible)”,还需克服几个关键难题:
规划不可控:分析路径每次不同,缺乏结构化“骨架”,效果不稳定;幻觉难以规避:缺乏约束,经常逻辑混乱、草木皆兵,造成理解与判断失真;例如,下图模型因为用户购买了故宫日历,就编造了「文化 IP 套利」的意图,并产生了用户没有的行为幻觉——“转售”。
幻觉示例
为此,我们正在打造一款新型的风险根因分析产品 —— DeepString RR(Reasonable & Responsible)。它在保留大模型“无监督探索”能力的同时,引入了领域图这一结构化约束,为探索赋予方向感,也让结果更具业务价值。目标是在 效果(Effectiveness)、效率(Efficiency)、确定性(Determinism)上,全面超越领域专家。目前在核心计费场景的验证中,初步展现潜力:精准率超过 90%,召回率接近 99.9%。
Demo 目前的能力主要包括三部分:任务规划(Task Planning)、工具选择与调用(Tool Selection/Calling)、结果生成(Response Generation),如下图所示。
能力简介
这与 OpenAI 提出的 深度研究(Deep Research)范式基本一致。也与近期热议的 Manus 在架构上颇有共鸣——强调任务规划、多 Agent 协作、工具调用,都是智能体范式下的复杂问题完整求解方案。不过与他们的通用性设计不同,我们更强调在风控场景的上下文扩展与图结构建模,突出大模型在异构环境中的主动推理与因果建构能力。接下来,将简要介绍其设计理念。
如前文所述,在高精度约束的识别体系下,风险识别系统往往难以对“上下文稀疏”的流量给出足够置信的判断。为破解这一难题,风控团队持续探索大规模异构图的建模与分析能力,尝试通过启发式搜索拓展上下文,化稀疏为稠密。这一思路与 OpenAI 提出的「深度研究」范式在理念上高度契合:模拟人类研究者的探索过程,引导大模型主动规划任务,在结构化空间中,进行跳跃式搜索与多轮压缩。尤其适用于处理高复杂度、信息稀疏、路径不确定的问题。
稀疏->稠密 演化示例
在风控场景的具体实现上,「深度」体现为动态图的演化机制:通过多跳(multi-hop)图搜索拓展上下文,再结合大模型的反思(Reflection)与自我批评(Self-Critique)能力进行路径剪枝,在压缩 Token 的同时保留关键信息。上图简单示意了上下文如何“从稀到密”:通过多跳探索,原本稀疏的节点逐步连成稠密的子图,为后续判断带来更多有价值的线索。
多跳探索示意
「研究」部分借助大模型的多模态理解与推理能力:我们为图谱节点构建融合文本、图像、统计与时序行为的描述,通过 System Prompt 结合检索式上下文注入,引导 LLM/VLM 进行语义分析与因果推理,从而生成更具深度和解释力的风险判断。
多模态理解与推断
大模型就像一个聪明但散漫的研究者,擅长发散思考,却常常跑题。于是我们引入了「领域图约束」:它不直接给出答案,而是一张动态演化的任务地图,指引模型该往哪里看、哪些可以跳过、什么值得深挖。就像 ControlNet 能用骨架结构引导 AI 作画,「领域图约束」则在推理中为大模型“定轨”。
领域图约束
如上图所示,DeepString 框架明确了攻击资源(Cause)与受害者(Effect)之间的因果边界,也约定了推理的起点、路径与终点。每次推理都要在异构图上开展启发式探索,过程中模型会启动反思与自我批评机制,决定是否回溯、补充上下文。例如,通过 Cause/Effect Miner 动态拓展图中潜在节点,再次进行判断,直到所有路径都闭合为置信的推理结论,或达到预设拓展上限。
这个过程像是一场“结构化的头脑风暴”:图负责限定边界、提供导航,大模型负责感知、推理与判断。两者协同,让探索既具智能,也不失方向。从“多跳路径挖掘”到“多轮自省收敛”,我们希望这条融合图结构与大模型的演化路线,能为风控任务带来更确定的智能,也让大模型真正做到——智圆行方。
我们期望打造的,是一套端到端的决策型风控系统——它不仅提供分析洞见,更能输出可直接落地的风控结论。在实现高效自动化的同时,为风控专家提供完全可审计、可调优的决策闭环。
深度领域感知:系统在动态图中运行,每个节点加载数千 Token 的 System Prompt,不仅提取通用知识,也融合了风控领域的抽象描述。多重校验机制:引入“分层摘要 → 幻觉检测 → 多模型辩论”的三步推理链,最大限度规避模型幻觉与判断偏差。全流程透明:对每一个样本的推理路径与证据链进行可视化展示,并以可回溯文档的方式嵌入最终报告。可控的自动化闭环:在实现全流程自动化的基础上,预留专家干预接口,支持任意环节的修改、续跑与重放。当前方案仍受限于大模型的 Token 长度,尚未实现规模化部署。但已初步验证其在理解复杂异构图结构与多模态知识方面的强大能力。而且幸运的是,问题到了这,风控已经和各个领域的发展建立了紧密连接。我们遇到的问题,也正在被全世界的专业团队不断突破,相信不久后就能给大家带来更激动人心的产品。
来源:小夭看天下