开源|MeiGen-MultiTalk:基于单张照片实现多人互动演绎 近日,美团推出了音频驱动的多人对话视频生成框架MultiTalk,并在GitHub上开源,首创L-RoPE绑定技术,通过标签旋转位置编码精准解决多音频流与人物错位难题。该框架创新性地采用局部参数训练+多任务学习策略,在保留复杂动作指令跟随能力的同时,实现自适应 开源 音频流 单张 dit 单张照片 2025-06-26 21:57 4