英伟达开源「描述一切」模型,拿下7个基准SOTA 图像描述(image captioning)生成一直是计算机视觉和自然语言处理领域面临的长期挑战,因为它涉及理解和用自然语言描述视觉内容。 模型 英伟达 开源 英伟达开源 基准sota 2025-04-25 19:03 3