摘要:GTC 2025 - 云与互联网线上中文专场将于北京时间 3 月 18 日 9:30 - 17:00 进行直播,聚焦四大热门 AI 话题,揭秘国内领先企业如何基于 NVIDIA 软硬件解决方案,在数据处理、模型优化等环节实现 “降本增效”。立即预约直播,获取
GTC 2025 - 云与互联网线上中文专场将于北京时间 3 月 18 日 9:30 - 17:00 进行直播,聚焦四大热门 AI 话题,揭秘国内领先企业如何基于 NVIDIA 软硬件解决方案,在数据处理、模型优化等环节实现 “降本增效”。立即预约直播,获取 LLM 软硬件协同优化的关键技术指南!
工作负载和业务场景优化,
驱动软硬协同加速计算创新
LLM 优化:从千亿参数训练到推理,如何实现模型性能与成本的双赢?MLLM 优化/应用:图文、音视频多模态交互背后的算力优化与推理效率挑战如何破解?数据科学:如何加速信息检索与大数据分析场景?如何实现低资源语言从数据预处理、模型调优到生产落地?搜推广:生成式广告、推荐的训练和推理技术创新和效率突破,如何提升用户价值与商业变现效率?GTC 2025 大会 - 云与互联网线上中文专场演讲
国内领先企业
分享软硬协同优化最佳实践
京东和美团带来搜推广的
创新解决方案
张泽华
京东算法总监
李健
京东算法架构师
会议主题:基于 TensorRT-LLM 的广告场景生成式推理加速方案
会议代码:S72995
会议时间:3 月 18 日 16:30
演讲介绍:
电商平台具有极其复杂的用户决策和行为逻辑,传统的推荐算法存在明显的容量瓶颈。而大语言模型在复杂模式识别、语义理解和泛化性上具有显著优势,配合 DPO 等偏好对齐算法在具体的召回优化任务上体现出极强的适应性和灵活性。LLM 及相关技术将推动搜索、广告和推荐领域的技术创新和效率突破。京东广告基于这一技术洞察,探索了一套可实现的生成式召回服务解决方案,并且基于 TensorRT-LLM 解决生成式大型模型的端到端推理性能问题。
于磊
美团资深技术专家
马驰
美团高级技术专家
会议主题:下一代生成式推荐模型训推引擎的建设和落地实践
会议代码:S74073
会议时间:3 月 18 日 16:30
演讲介绍:
大模型技术在搜索、推荐和广告领域的应用如火如荼,尤其是以生成式推荐为代表的研究被视为下一代搜推广稀疏大模型的全新技术路线,成为各大公司争相探索和落地的方向。
本次分享主要介绍我们基于 Torch 搭建的一套易于使用的高性能分布式训推框架,低成本支持类似 GPT-3 计算规模甚至更大 FLOPS 的稀疏大模型的训练、推理、部署和线上实验。引入生成式推荐技术后,多个业务场景下都观察到了扩展定律 (scaling law),线上 AB 实验也取得了一定的效果收益。
Votee AI 和 NVIDIA
为数据科学带来创新突破
陈豪杰
Votee AI
首席技术官
钟卓熹
Votee AI 人工
智能研究工程师
会议主题:使用 NVIDIA 技术为你的母语构建 LLM
会议代码:S71445
会议时间:3 月 18 日 15:00
演讲介绍:
我们将提供详细的路线图,以便使用 NVIDIA 强大的 GPU 架构和软件工具训练专为资源稀缺语言(例如广东话/粤语)训练的大语言模型。
了解如何使用 NeMo Curator 预处理数据集,以高效处理语言细微差别,并利用 NeMo 框架优化模型训练和超参数调优。我们将探索专为资源稀缺语言设计的架构调整,演示模型性能的量化,并分享重点介绍实际应用的案例研究。最后,您将拥有切实可行的实施和部署 LLM 的策略,以满足服务水平低下的语言社区的独特需求。
黄瓒
NVIDIA 加速计算专家
会议主题:在 GPU 上加速基于位图的集合操作
会议时间:3 月 18 日 16:00
演讲介绍:
从信息检索到各种大数据工作负载(包括混合检索和留存分析),高效的集合操作可使许多应用受益。
Bitmap 是构建高性能集合操作工具包的基本数据结构,我们看到其中一些工具包在行业中取得了巨大成功。与此同时,GPU 上基于位图的集合操作工具包仍需进一步优化。
在本次演讲中,我们将分享基于位图的集合操作优化实践,详细阐述高效集合并集、交集、差集和其他操作的设计和实现要点,并展示如何与现有的基于排序数组的 GPU 集合操作工具包 (如 Thrust) 合作。通过充分利用 GPU 设备显存带宽和高效的线程调度机制,并通过位图减少显存占用,我们可以在密集集合的运算上提供比现有工具包更高的吞吐量。
LLM 优化、MLLM 优化/应用
演讲概览
会议目录 | GTC 2025 | NVIDIA
演讲详情请点击下方链接,跳转了解精彩内容。
GTC25 | 预约云与互联网线上中文专场,解锁 LLM 优化
「链接」
GTC25 | 云与互联网线上中文专场预约中,点击注册探索 MLLM 优化与应用
来源:杭杭谈电竞