query

RAG时代也要懂的召回和排序逻辑

无论是之前的搜索、问答、推荐还是目前基于大模型的RAG,召回和排序仍然是核心的两个工程模块。召回排序在不同场景有很多不同的算法和工程化实现方式,我们简单聊下其中的有代表性的方法。

逻辑 rag query ctr rag时代 2025-06-03 09:51  5

开源模型竟被用于窃取下游微调数据?

然而,清华大学、墨尔本大学的这项研究工作指出了该范式下的一种新型隐藏安全风险: 开源模型的发布者可以在开源之前埋下后门(不影响模型通用性能),并进而利用该后门从下游基于该开源模型微调得到的下游模型中窃取微调数据(仅需黑盒权限) !

模型 开源 llm query 后门 2025-05-28 11:49  4

在零售技术做AI的95后:我们这样搞定技术难题

拿到这道题时,我在思考:是否可以用多个奖励小模型的组合来替代单一奖励大模型呢?让每个小模型专注评判图片的某一类问题,如商品形状、摆放位置、色彩搭配等,降低单一模型的学习难度,同时提升评判的精细度;另一方面多奖励模型意味着更灵活的业务规则嵌入和更丰富的模型组合方

零售 技术 query epsilon dmax 2025-05-26 15:45  7

Power Query获取分组TOPN数据

大家好,继续给大家来分享一下Power Query的数据清洗技巧。今天的技巧是去获取分组数据的前安名,就TOPN。就像大家现在屏幕上看到这个数据,一会要把这个数据基于地区,就是这些大区去做数据分组。分组完之后想提取每个大区的总价值的前五名,当然也可以是前两名、

query 分组topn topn数据 powerquery 2025-05-24 22:11  8

excel怎么把横排变竖排

大家好!今天赶报表又被老板吐槽数据排版乱?💔 明明横排数据密密麻麻看得眼晕,想要转成竖排却只会复制粘贴到手抽筋?别慌!这篇笔记手把手教你用Excel自带的隐藏功能,3分钟搞定行列转换,从此告别加班!👇

单元格 excel query 数组公式 竖排 2025-05-23 14:26  7

深入浅出DDD:从理论到落地的关键

随着互联业务的发展、业务逐渐的复杂,传统代码架构在日常开发中存在的多种弊端,如代码混乱、补丁式开发、迭代成本高等问题,大大影响了迭代的效率。本文作者借助 DDD 的战略设计和战术设计,介绍了如何通过限界上下文、领域模型、聚合、资源库等概念,实现业务逻辑与技术的

query entity cqe ddd dto 2025-05-22 18:47  6

注意力机制详解与应用场景

注意力(Attention)机制是深度学习中的一种重要技术,尤其在自然语言处理(NLP)、计算机视觉(CV)和语音识别等领域表现突出。它通过动态分配权重,让模型在处理输入时“聚焦”于关键信息,有效解决了长距离依赖、信息瓶颈等问题。以下是对注意力机制的详细解析:

应用 transformer 详解 query 机器翻译 2025-05-16 20:25  7

代理式AI的综合教程:从基础快速响应到全自主代码生成与执行

在本教程中,我们将讲解代理式架构的五个级别,从最简单的语言模型调用到完全自主的代码生成和执行系统。本教程专为在Google Colab上无缝运行而设计。从一个简单的“处理器”开始(仅回显模型输出),你将逐步构建路由逻辑、集成外部工具、编排多步骤工作流,并最终使

代理 prompt query def 代码生成 2025-05-15 15:21  7

DeepSeek 成功证明:动力是 AI 创新的关键

2025 年 1 月震撼了 AI 领域。看似势不可挡的 OpenAI 以及实力雄厚的美国科技巨头,都被我们可以称之为大语言模型( LLM )领域的“黑马”所震惊。DeepSeek 是一家中国公司,以前鲜为人知,却突然向 OpenAI 发起了挑战。实际上,Dee

创新 单词 deepseek moe query 2025-04-29 21:47  10

别再被GQA难住!通俗解读来了~

按需备货:查询头保留独立配置,键值头按组共享,减少重复计算灵活分餐:用repeat_interleave魔法,让每个厨师都能拿到对应组的食材高效出餐:相比MHA,直接砍掉2/3的KV存储量,长文本场景显存暴降75%!

键值 query 显存 kv gqa 2025-04-24 05:01  8

1W8000字 从理论到实践: MCP 在 7 大 AI 框架中的具体应用

AI代理工具包为开发者开放了各种API,让AI解决方案具备执行任务的工具,确保能给出准确结果,提升用户满意度。然而,把这些工具集成到AI应用里并进行管理,过程往往很繁琐。本文将为你介绍一种行业标准方法——利用模型上下文协议(MCP),为大语言模型(LLM)和代

应用 llm prompt query mcp 2025-04-05 18:41  9

改进RAG:利用混合搜索与重排序优化检索效果(含代码示例)

RAG 通过结合信息检索和语言生成能力,让模型在生成文本时能够参考相关的外部知识,从而生成更准确、更具针对性的内容。然而,在实际应用中,RAG(企业 RAG 准确性提升全流程指南:从数据提取到精准检索) 面临着诸多挑战,其中准确检索相关信息是关键问题之一。本文

搜索 代码 rag query postgresql 2025-04-02 14:55  8

只是文档灌Dify?RAG发展一篇文就入门!

LLM 训练不是实时的,而是离线训练好的。在训练过程中,使用的数据都是提前准备的,而且大多数是公开、开源的数据,这就导致了 LLM 训练后具备的知识是有范围的。换句话说,模型知识仅限于训练数据所涵盖的知识范围,对于新的知识(比如今天的新闻)或未训练的知识(比如

rag llm query dify naive 2025-04-02 09:17  10