rl

射频测试中的常见术语有哪些?

射频(RF)测试在无线通信、电子设备以及许多其他领域中是至关重要的。为了有效开展射频测试,了解一些常见术语可以帮助工程师和技术人员更好地理解测试过程及其结果。以下是射频测试中的一些常见术语:

射频 rl 驻波比 vswr 反射系数 2025-03-24 16:19  2

田渊栋和SergeyLevine参与开发新型RL算法

强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。现实世界中,很多任务很复杂,需要执行一系列的决策。而要让智能体在这些任务上实现最佳性能,通常需要直接在多轮相关目标(比如成功率)上执行优化。不过,相比于模仿每一轮中最可能的动作,这种方法的难度要大得

算法 rl 田渊 rl算法 sergeylevine 2025-03-23 18:25  4

50条数据解锁空间智能,RL视觉语言模型3D空间推理框架|西北大学

在三维空间理解任务中,让视觉语言模型(VLM)生成结构合理、物理一致的场景布局仍是一项挑战。以“请将这些家具合理摆放在房间中”为例,现有模型尽管能够识别图像中的物体,甚至给出语义连贯的布局描述,但通常缺乏对三维空间结构的真实建模,难以满足基本的物理约束与功能合

模型 推理 西北大学 rl rl视觉 2025-03-22 16:34  3

从零复现满血版 DeepSeek-R1

近期,我们团队发布了 Ligth-R1,是第一个从零复现满血版 DeepSeek-R1 的工作(几个小时后QWQ-32B发布),虽然大家都在关注 QWQ-32B,但是 QWQ-32B 只开源了模型,而我们把模型、数据、代码全部都开放出来了。

开源 rl dpo cot aime 2025-03-14 21:16  6