kv资讯_360影视

又快又精准！另辟蹊径的批量KV查询系统优化实践

在现代推荐系统中，需要以尽可能低的延迟在海量的数据中快速计算出与用户最相关的top-N。而其中能够管理海量数据并支持高速批量查询的存储系统是最重要的组件之一。如下图所示，无论是在召回、排序阶段，还是在离线模型训练期间，更多的特征和更快的计算通常会带来更好的推荐

哈希表 simd kv kv查询批量kv 2025-06-11 09:51 5

卡内基梅隆团队：稀疏注意力如何优化大模型？

卡内基梅隆大学的研究团队Ranajoy Sadhukhan、Zhuoming Chen（共同第一作者）、Haizhong Zheng、Yang Zhou、Emma Strubell和Beidi Chen在2025年6月5日发表了一项突破性研究，题为《Kinet

模型卡内基梅隆卡内基梅隆 kv 2025-06-10 21:52 7

一块4090搞定实时视频生成！Adobe黑科技来了

近年来，视频合成技术已经取得了显著突破。其中，基于双向注意力机制的扩散 Transformer（DiT）可以生成具有复杂时序动态的逼真内容，但其非因果性设计导致无法满足实时流媒体等场景需求。

视频黑科技 adobe kv adobe黑科技 2025-06-10 12:05 8

康奈尔大学研究团队突破性融合自回归与扩散技术

在2025年6月2日发表于arXiv的预印本论文《Esoteric Language Models》中，康奈尔理工学院和康奈尔大学的研究团队，包括Subham Sekhar Sahoo、Zhihan Yang（联合第一作者）等多位研究者提出了一种突破性的语言模

研究康奈尔大学掩码 kv kv缓存 2025-06-07 21:32 5

KVzip团队：如何用压缩技术提升大模型记忆力？

论文《KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction》于2025年5月29日发表在arXiv预印本平台（arXiv:2505.23416v1），由首尔国立大学和NAV

模型记忆力 kv kvzip kvzip团队 2025-06-03 21:45 7

KVzip：全新压缩技术让AI大模型记忆力翻倍

论文《KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction》于2025年5月29日发表在arXiv预印本平台（arXiv:2505.23416v1），由首尔国立大学和NAV

模型记忆力 kv kv缓存 kvzip 2025-06-03 15:34 4

单卡也能跑万帧！智源发布Video-XL-2，速度、效果、长度全拉满

智源研究院发布开源模型Video-XL-2，显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化，支持单卡处理万帧视频，编码2048帧仅需12秒。

模态开源显卡单卡 kv 2025-06-03 14:09 6

英伟达合作推出Fast-dLLM框架，AI推理速度最高飙升27.6倍

科技媒体 marktechpost 昨日（6 月 2 日）发布博文，报道称英伟达联合麻省理工学院（MIT）、香港大学，合作推出 Fast-dLLM 框架，大幅提升扩散模型（Diffusion-based LLMs）的推理速度。

英伟达推理 llm kv parallel 2025-06-03 11:30 6

扩散语言模型九倍推理加速！KV Cache并非自回归模型专属

训练无关，即插即用。dLLM-Cache完全在推理过程中工作，无需修改模型参数或重训练。dLLM-Cache可以在完全不损失模型输出质量的前提下，带来最高9.1倍的推理速度提升。

模型推理语言 cache kv 2025-05-27 16:59 8

高压放大器在等离子体激发中的关键作用与技术进展

等离子体激发作为物质第四态的能量调控手段，在工业制造、材料科学、生物医疗等领域具有广泛应用。其核心在于通过外部能量输入使气体电离生成等离子体，而高压放大器作为能量供给的核心器件，直接影响等离子体的生成效率、稳定性和可控性。随着精密制造与科研实验对等离子体参数的

放大器等离子体脉冲电场 khz kv 2025-05-21 11:19 7

ICML 2025｜如何凭「自动补全」实现100K生成3×加速？

在当前大模型推理愈发复杂的时代，如何快速、高效地产生超长文本，成为了模型部署与优化中的一大核心挑战。随着 GPT-o3, DeepSeek R1 等具备「超级上下文窗口」能力的大模型持续刷新业界记录，百万甚至千万 Token 级别的推理任务已从研究话题迈入

补全 token 2025 kv 100k 2025-05-19 17:56 10

一张图带你看华为新品发布会，史上最强nova全面信息汇总来了

5月18日，华为终端官方正式释出华为nova 14系列新品发布会直播信息，一张图清晰标示出发布会时间、名称与主要直播平台。至此，华为nova 14系列的核心卖点均已在预热中大致明确，而发布会的关注热度也随之推至高潮。

华为鸿蒙 nova 趣玩 kv 2025-05-18 13:34 7

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

本文由华东师范大学和小红书联合完成，共同第一作者是华东师范大学在读硕士、小红书 NLP 团队实习生黄文轩和翟子杰，通讯作者是小红书 NLP 团队负责人曹绍升，以及华东师范大学林绍辉研究员。

视觉 iclr token cache kv 2025-04-29 14:32 8

别再被GQA难住！通俗解读来了～

按需备货：查询头保留独立配置，键值头按组共享，减少重复计算灵活分餐：用repeat_interleave魔法，让每个厨师都能拿到对应组的食材高效出餐：相比MHA，直接砍掉2/3的KV存储量，长文本场景显存暴降75%！

键值 query 显存 kv gqa 2025-04-24 05:01 9

注意！注意！侦测到前方高能色彩大迸发！

🫣眼睛不要动哦~ 👻毛茸茸的LABUBU马上就要从你手机屏幕中跳出来啦！ 📱快快用“泡泡玛特”APP 扫描任意门店“前方高能系列展桌”体验超级炫酷可爱的AR能量场域 🎇让可爱的LABUBU用色彩魔法点燃你的高能一天！ 🎮具体体验步骤如下：打开“

玛特色彩毛茸茸 labubu kv 2025-04-24 01:10 8

AI Infra 的“中场战事”：推理业务，还在提速

从 OpenAI 于 3 月 27 日宣布全面支持 MCP 协议开始，市面上的 MCP Server 数量，在不到一个月的时间里，逼近了 10,000 大关。接下来， Google 在 4 月 10 日为 Gemini 系列模型添加了对 MCP 协议的支持，称

推理 cache infra aiinfra kv 2025-04-24 17:40 9

科技论| 1.96 kV p-Cr₂O₃/β-Ga₂O₃异质结二极管，理想因子1.07

由西安电子科技大学的研究团队在学术期刊 Applied Physics Letters 发布了一篇名为1.96 kV p-Cr2O3/β-Ga2O3 heterojunction diodes with an ideality factor of 1.07（1

异质结二极管 kv hrtem 异质结二极管 2025-04-17 08:57 10

中国算力市场，不能只讲“堆卡”的故事

当以“降本”闻名的马斯克对外公布由 10 万个液冷 H100 GPU 组成的超大集群，并宣布未来几个月内还要再增加 10 万颗 GPU 时，业界对 AI 基础设施的衡量标准，一时间变得有些单一——大家更倾向于对比卡的数量，而对集群性能，尤其是特定业务场景下的性

阿里云 pai oss cache kv 2025-04-09 18:35 9

如何选择适合您的X射线无损检测设备

在工业检测领域，X射线无损检测(RT，Radiographic Testing)设备以其对内部缺陷“看得见”的优势，被广泛应用于焊缝检测、铸件质量控制、电子元件封装检查等领域。但面对种类繁多、参数复杂的X射线检测设备，许多采购人员和技术工程师常常感到无从下手。

工件成像 x射线 kv 屏蔽室 2025-04-08 23:21 10

Consul服务治理机制详解

Consul 是 HashiCorp 开发的一款分布式服务网格工具，专注于服务发现、配置管理和服务治理。其服务治理能力主要通过以下核心机制实现：

api envoy kv consul consul服务 2025-04-03 19:33 13