UniToken:多模态“全能选手”,一次编码搞定图文理解与图像生成 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 模态 图像 图文 编码 unitoken 2025-04-25 14:41 3