推理

121W,确实可以封神!

LLM+奖励模型 :当下的迫切需求!大模型生成的毒性内容、幻觉等问题严重影响落地,而奖励模型虽对提升对齐效果作用显著,但目前泛化能力都很弱,难以应对复杂任务。可以关注代理型奖励模型、自我反思奖励模型……

模型 推理 llm 关键帧 reward 2025-06-27 04:40  3

9.9万起,零次方推出“全模态”数据方案

在具身智能研发中,往往普遍存在以下数据问题:数据模态缺失、数据采集流程繁琐、任务数据管理繁杂、模型训练推理部署门槛高等难题。诸多瓶颈成为具身智能模型从实验室走向规模化应用的“拦路虎”。零次方深耕具身智能领域,以自身模型开发经历为基础,深悉行业痛点,推出“全模态

模态 推理 触觉 高维 次方 2025-06-26 14:36  4

推理越多,幻觉越重?多模态推理模型的“幻觉悖论”

多模态推理模型真的「越想越明白」吗?研究表明,R1系列模型在推理链条加长的过程中,其视觉感知能力出现下降趋势,生成内容有时会偏离图像本身,出现「看见」不存在事物的幻觉现象。推理能力的提升,在一定程度伴随着视觉对齐的弱化,呈现出「越推理越幻觉」的倾向。这一现象引

模态 推理 幻觉 悖论 幻觉悖论 2025-06-26 07:05  3

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」

在大语言模型(LLM)加速进入法律、医疗、金融等高风险应用场景的当下,“安全对齐”不再只是一个选项,而是每一位模型开发者与AI落地者都必须正面应对的挑战。然而,如今广泛采用的对齐方式,往往只是让模型在检测到风险提示时机械地回复一句“很抱歉,我无法满足你的请求”

推理 蒙特卡洛 icml oral 偏序 2025-06-26 06:02  4

红帽大中华区总裁曹衡康:混合云成趋势 AI价值不限于“单点推理”

在生成式AI加速融入企业数字化进程的当下,云计算正在经历深层次技术重构。过去十年,云厂商主导的增长逻辑更多围绕基础设施扩展与算力堆叠,但如今随着AI模型的训练与推理需求快速上升,企业客户开始关注如何以更低成本、更高效率地将AI能力部署到混合云、边缘和私有环境中

推理 红帽 混合云 曹衡 单点推理 2025-06-25 17:06  4

AI自动化背后:凡是可量化的,皆不能幸免

伴随着AI的迅速发展,几乎每个劳动领域都面临冲击,像创意工作、数据分析等,只要能被量化的任务,都可能被自动化。对于那些引领组织穿越这场动荡转型的领导者而言,应对方法很简单。支持那些投资回报率模糊的冒险赌注,奖励那些重新定义问题并勇于探索未知的团队。留出空闲时间

模型 推理 自动化 克里斯蒂安 计算能力 2025-06-24 15:15  4

强化学习怎么入门好?

最近在做一个跟强化学习有关的项目,在csdn等网站上了解了MDP,值函数等基本知识,接着学习Q学习、Sarsa等算法,但是感觉有些囫囵吞枣,有没有比较好的入门方法打好基础呢

学习 推理 rl kl rl训练 2025-06-23 19:58  4