一个基于推理大语言视觉的检测模型：VLM-R1

摘要：借鉴DeepSeek推理模型的思路，上传一张图片，输入描述文字，模型会返回思考过程和区域标注，检测区域还挺准确的，也支持中文。体验地址：https://huggingface.co/spaces/omlab/VLM-R1-Referral-Expression

借鉴DeepSeek推理模型的思路，上传一张图片，输入描述文字，模型会返回思考过程和区域标注，检测区域还挺准确的，也支持中文。

体验地址：https://huggingface.co/spaces/omlab/VLM-R1-Referral-Expression开源地址：https://github.com/om-ai-lab/VLM-R1

来源：AI工具箱

标签：模型推理开源视觉语言

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!