DeepMind悄悄发布PaliGemma二代,最易微调视觉语言全能王来了 PaliGemma 2在多个任务上取得了业界领先的成绩,包括图像描述、乐谱识别和医学图像报告生成;并且提供了不同尺寸和分辨率的版本,用户可以根据不同的任务需求进行微调,以获得更好的性能。 全能王 paligemma 语言全能王 2024-12-11 15:22 2