dpo资讯_360影视

Text2SQL准确率暴涨22.6%！3大维度全拆

技术背景：TEXT2SQL 是将自然语言查询转为 SQL 的任务，经历了基于规则、神经网络、预训练语言模型、大语言模型四个阶段。当前面临提示优化、模型训练、推理时增强三大难题，研究基于 BIRD 数据集展开。

当你在社交媒体上看到关于某个政治话题的讨论时，是否注意到AI助手有时候会偏向某一方的观点？这个现象背后隐藏着一个重要问题：如何让人工智能在面对不同政治立场时保持公正？来自哥伦比亚大学计算机科学系的研究团队最近在这个领域取得了重要突破。

在当今快速发展的人工智能领域，大型语言模型（LLMs）已经展现出令人惊叹的文本生成能力。然而，当涉及到生成长篇文本时，这些模型仍然面临着巨大挑战，尤其是在保持连贯性、确保逻辑一致性以及随着文本长度增加而维持质量方面。新加坡科技设计大学和清华大学的研究团队在一项

2025年5月30日，由意大利国家科学技术研究委员会信息科学技术研究所(CNR-ISTI)与皮萨大学计算机科学系以及意大利国家计算语言学研究所"Antonio Zampolli"(CNR-ILC)的研究团队共同发表了一篇题为《压力测试机器生成文本检测：通过改变

如今新的变化又出现了。5月28日，路透社报道，在伦敦长时间推进上市未果后，SHEIN正努力寻求在香港上市。有消息人士称，SHEIN计划在未来几周向香港证券交易所提交招股书草案，目标是今年登陆港交所。

大型语言模型（LLMs）已经在代码生成领域取得了显著进步，但生成的代码虽然功能正确，却往往存在效率低下的问题。这一研究缺口正是由南洋理工大学、新加坡国立大学、香港大学、西安交通大学和字节跳动的联合研究团队着手解决的。在最近发表的论文《Afterburner:

在视觉多模态大语言模型的快速发展中，幻觉问题一直是研究者们关注的焦点。模型生成与输入图像不一致甚至虚假的内容，不仅影响用户体验，也阻碍了多模态技术在实际场景中的落地。对此，微软亚洲研究院和香港中文大学的联合研究团队从直接偏好优化（DPO）入手，提出了 On-P

在2025年5月28日发布的arXiv预印本论文《RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction》中，研究者提出了一种突破性的图

为深入探讨数据保护官（DPO）在应对复杂数据安全合规环境中的关键作用及实践路径，深圳数智引领科技有限公司于近期成功举办了一场以 “数据保护官DPO：律师法务如何应对人工智能时代数据合规挑战” 为主题的沙龙活动，汇聚了众多行业精英、专家学者以及企业代表，共同为数

当今最先进的大语言模型，以其惊人的文本生成能力改变着世界。从流畅自然的对话，到条理清晰的报告，再到富有创意的故事，它们似乎无所不能。然而，要让这些庞然大物真正“听话”、输出符合人类偏好的结果，仅仅依靠海量数据进行预训练是远远不够的。一个关键的后续步骤——微调（

学习动态（Learning dynamics）描述了特定训练样本的学习过程如何影响模型对其他样本的预测，为我们理解深度学习系统的行为提供了有力工具。我们通过分析不同潜在响应之间影响积累的逐步分解，研究了大型语言模型在不同微调类型中的学习动态。我们的框架能够统一

模型语言 iclr rl dpo 2025-04-18 22:20 11

在 AI 的世界里，大型语言模型（LLMs）凭借强大的参数量和计算能力，已经能够生成与人类偏好高度一致的回答，成为 ChatGPT 等明星产品的核心。然而，这些“大块头”模型对算力和内存的需求极高，难以在手机、边缘设备等资源受限场景中普及。

近期，我们团队发布了 Ligth-R1，是第一个从零复现满血版 DeepSeek-R1 的工作（几个小时后QWQ-32B发布），虽然大家都在关注 QWQ-32B，但是 QWQ-32B 只开源了模型，而我们把模型、数据、代码全部都开放出来了。

开源 rl dpo cot aime 2025-03-14 21:16 14

近日，三六零自研AI大模型360智脑7B参数升级版（360Zhinao2-7B）正式开源，现已上线Github开源社区（github.com/Qihoo360/360zhinao2），可免费商用。该模型是继今年4月 360Zhinao1-7B 开源后的重要更新

模型开源 dpo 2024-12-03 10:35 21

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqiz

rlhf dpo una 2024-10-10 00:04 20