模态模型

SmolVLM2轻量级视频多模态模型,应用效果测评(风景、事故、仿真、统计、文字、识物)

SmolVLM2 是由 Hugging Face 开发的一系列紧凑型但功能强大的大型模型,旨在为资源受限的设备(如智能手机和嵌入式系统)带来先进的语言和视觉语言处理能力。这些模型以其小型化设计著称,适合在设备上运行,填补了大型模型与小型设备性能差距的空白。本文

模型 模态 模态模型 smolvlm2 smolvlm2轻量 2025-05-30 09:23  7

阿里巴巴盘前涨超1% 发布通义千问系列的最新旗舰模型Qwen2.5-Omni

消息面上,北京时间周四凌晨,阿里巴巴发布通义千问系列的最新旗舰模型Qwen2.5-Omni。这款端到端多模态模型专为广泛的多模态感知设计,能够处理文本、图像、音频和视频等多种输入,同时能够通过生成文本和合成语音提供实时流式响应。模型性能方面,Qwen2.5-O

模型 模态 音频 模态模型 阿里巴巴 2025-03-27 18:58  11

大模型和具身智能究竟是什么关系?

具身智能与大模型频频被提及,但具身智能 = 机器人 + 大模型吗?本文摘自北京邮电大学人工智能学院副教授陈光(@爱可可-爱生活)的新书《走进具身智能》,作者很明确地表示,大模型虽然是实现具身智能的重要工具,但并不是其全部。当前,包括英伟达、智源、智元等多家机构

模型 模态 智能 模态模型 人机交互 2025-03-27 14:42  12