腾讯研究院AI速递 20241210

摘要:o1 Pro挑战普特南数学竞赛,完成12道题用时36分钟16秒,展现出超高速度与高难度解题能力;

生成式AI

一、 实测用o1 Pro挑战最难本科数学考试,36分钟16秒交卷

1. o1 Pro挑战普特南数学竞赛,完成12道题用时36分钟16秒,展现出超高速度与高难度解题能力;

2. 对部分题目作答出现漏答或不完全正确的情况,尚需完善优化;

3. 尽管存在一些错误,o1 Pro在生成思维链和解释复杂问题时仍表现出强大的潜力。

二、 Runway Act One又更新:表演和声音无缝融入新视频角色

1. Runway Act One能将视频中的表演动作或声音套用到数字角色,简化动画制作流程;

2. 它支持多风格角色动画和电影级逼真输出,能捕捉微表情和面部细节;

3. Act One在电影、游戏和虚拟现实等领域具有广泛应用,同时将考虑技术安全与责任使用。

三、 30秒完美复刻,海螺AI海外版上线超强AI语音克隆功能

1. 海螺AI推出的中文语音克隆技术,能在30秒内完美复刻任意人的声音;

2. 该技术支持多种情绪表达,克隆效果准确,情感丰富,超越了传统AI语音克隆的局限;

3. 目前免费开放,用户可以轻松上传音频进行个性化语音克隆,成功率高且无需繁杂操作。

四、 SOLAMI,VR端3D角色扮演端到端AI!唱跳都能陪你玩

1. SOLAMI是首个支持VR端3D角色扮演的AI系统,能够通过语音和肢体语言实现沉浸式互动;

2. 该系统利用端到端VLA模型,结合动作、语音和面部表情,提供更自然的互动体验;

3. SOLAMI通过合成数据集克服数据稀缺问题,并在实验中展现出比传统方法更优的动作质量和响应速度。

五、 “可灵AI导演共创计划”9位知名导演9部AIGC电影短片

1.“可灵AI导演共创计划”联合9位知名导演推出9部AIGC电影短片上线,涵盖多种题材;

2.这些短片全部由可灵AI生成,推动AIGC技术在影视领域的深度融合,提升内容生产效率;

3.计划旨在探索AI与人类创作的合作模式,降低视频制作门槛,推动电影级内容创作。

六、 北交开源o1,源代码、精选数据集以及衍生模型通通开源

1. 北京交通大学推出O1-CODER,结合强化学习与蒙特卡洛树搜索(MCTS)进行编码任务优化,开源代码、数据集与衍生模型;

2. 通过伪代码引导深度推理,结合测试用例生成器提高代码生成质量,实验表明生成测试用例的通过率提升至89.2%;

3. 自我对弈强化学习与过程奖励模型(PRM)迭代优化策略模型,实现推理与代码生成的持续改进。

七、 OpenAI 为筹集更多资金,计划放弃微软 “AGI” 限制条款

1. OpenAI计划修改与微软的协议,放弃AGI条款,以便微软继续投资和使用其技术;

2. 该条款原本旨在防止AGI滥用并确保非营利董事会控制,但OpenAI需要更多资金来应对竞争;

3. OpenAI正在转型为公共利益公司,正在面临部分投资者和创始人如Elon Musk的反对。

前沿科技

八、 从元宇宙到医疗模拟,触觉技术距离更真实人机交互还有多远?

1. 触觉技术正在快速发展,未来应用广泛,包括元宇宙、医疗模拟和智能家居等领域;

2.AE-Skin和ViTaM系统等结合AI和机器学习,提供了更精准、沉浸式的互动体验;

3. 多项研究推动触觉技术的创新,包括新型触觉手套、智能传感器和生物弹性材料等。

报告观点

九、 Scaling Law不是唯一视角!清华最新提出Densing Law

1. 清华刘知远团队提出大模型“密度定律”,模型能力密度每100天翻一倍;

2. 密度定律推论模型推理成本大幅下降,能力密度加速增长,揭示端侧智能的巨大潜力;

3. 密度定律与摩尔定律相交,推动AI在更低资源下实现更强性能,提升AI可持续发展潜力。

十、 OpenAI六年元老再发文:AI狂飙,应该拉手刹还是踩油门?

1. Miles Brundage认为AI发展速度应谨慎放缓,当前进展远超社会理解与应对能力;

2. AI发展需考虑不同规模和层面的风险,单一加速或减速都难以解决问题;

3. 他提议通过“刹车”措施(如算力储备)控制AI发展步伐,以便为可能的风险做好准备。

来源:腾讯研究院

相关推荐