吉林大学团队:首创多模态AI错误识别评估框架
这项由吉林大学人工智能学院杨海琪、李金哲、李庚旭、常毅、吴元等研究者完成的重要研究,发表于2025年8月6日的计算机视觉领域权威期刊,探索了一个关乎AI安全性的关键问题。感兴趣的读者可以通过arXiv:2508.04017v1访问完整论文,研究代码已在GitH
这项由吉林大学人工智能学院杨海琪、李金哲、李庚旭、常毅、吴元等研究者完成的重要研究,发表于2025年8月6日的计算机视觉领域权威期刊,探索了一个关乎AI安全性的关键问题。感兴趣的读者可以通过arXiv:2508.04017v1访问完整论文,研究代码已在GitH
在AI技术日新月异的今天,如何有效评测大模型性能成为测试工程师面临的新挑战。本文将带您深入探索构建AI测试平台的实战过程,分享多模态模型评测的关键技术与设计思路。
国家知识产权局信息显示,浙江研煌科技有限公司申请一项名为“一种基于多模态大模型的数字人视频生成方法”的专利,公开号CN120472059A,申请日期为2025年04月。
该智能体支持语音、文本多模态交互,其语音系统由双方联合研发,覆盖唤醒、识别、理解、播报全链路,应用全双工技术实现随时打断交互,并具备复杂声学环境抗回声能力。系统整合高德导航专用ASR模型、通用大模型ASR及综合理解模型,覆盖导航、本地生活及日常对话场景。
微信公众号2024年12月6日发布,视觉中国宣布与国内知名短视频社交平台——北京快手科技有限公司(以下简称“快手科技”)达成战略合作协议,双方将共同研发和部署人工智能多模态大模型,以科技创新为驱动力,共同赋能视觉内容的创作与价值变现,引领行业进入智能化新时代。
OpenGithub社区:https://open.itc.cn/Github : https://github.com/OpenGithubs>>搜索开源推荐官头条社区: >>搜索开源推荐官知乎社区: >>搜索Open Github社区订阅榜单: >>Git
与GPT-3到GPT-4的惊艳跨越相比,GPT-5的发布略显匆忙:翻车的数据图表、带bug的代码演示、误导的“博士级”科学原理解释,以及作为核心技术更新的“Router”(路由器)也被硅谷AI从业者指出是已经存在好几年的技术。
近年,人工智能(AI)正成为驱动智能手机行业创新与变革的核心引擎。8月7日,三星在北京举办了“Galaxy Z系列AI体验官”活动,展示了其最新一代折叠屏旗舰手机——Galaxy Z Fold7与Galaxy Z Flip7,及其搭载的创新Galaxy AI与
7 月 27 日,腾讯发布了具身智能开放平台 Tairos,以模块化的方式向行业提供大模型、开发工具和数据服务,试图为具身智能的研发和应用提供一套通用的支撑体系。
近日,博时特科技强势推出了一款商显智慧终端——AI数字人智能交互一体机。该款AI数字人智能交互一体机拥有人脸识别、语音互动、触控查询、导览解说、迎宾接待、业务办理等多功能服务模块,可以实现多模态交互、智能问答、场景化服务等功能。在客服、信息传播、教育、文旅等多
当马斯克高调宣称Grok4"碾压所有研究生"时,OpenAI的GPT-4o却用实际表现给了当头一棒!这场科技巨头的AI对决,胜负早已藏在用户体验的细节里...
本周三,马斯克在面向广告商的一场讨论中表示,计划在其人工智能产品Grok中引入广告推送机制,以后Grok回答问题时将会插入广告内容。
但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点、到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。
国家知识产权局信息显示,武汉理工数字传播工程有限公司申请一项名为“一种基于多模态的声音生成方法”的专利,公开号CN120452412A,申请日期为2025年05月。
这项由Skywork AI多模态团队完成的研究发表于2025年8月,展示了他们开发的Skywork UniPic模型的卓越能力。有兴趣深入了解的读者可以通过GitHub(https://github.com/SkyworkAI/UniPic)和HuggingF
万众瞩目的GPT-5发布在即! 根据开发者社区最新动态,GPT-5核心代码已现身GitHub,其革命性突破集中在AI智能体(Agent)和AI编程两大领域——不仅能像“脑部助手”般自主拆解复杂任务,还能零代码生成高精度应用程序。随着技术泄露细节曝光,A股AI产
2025年8月8日,OpenAI将于明日正式发布其最新一代大型语言模型——GPT-5。这一消息在人工智能领域掀起了轩然大波。作为GPT系列的第五代产品,GPT-5被寄予厚望,不仅因为其前代模型(GPT-3、GPT-4)已经显著改变了我们与AI交互的方式,更因为
近期,一份由QuestMobile发布的《2025年AI应用市场半年报》在行业内引起了广泛关注。报告显示,百度AI搜索在月活跃用户规模上取得了显著成绩,用户数量高达3.22亿,稳坐国内AI搜索行业的头把交椅。
国家知识产权局信息显示,三河市米大投科技有限公司申请一项名为“一种多模态融合AI数字人直播生成系统”的专利,公开号CN120430180A,申请日期为2025年04月。
公司2023年半年报:公司将大模型引擎与课程教案、课堂视频、作业测验、考试实验等私有化多模态教学大数据深度融合,形成教育专用、学校专用的大模型。目前竞业达教育大模型已支持预训练数据和私有化数据双重加载、多模态自定义知识库实时加载、私有化知识二次预训练、多轮对话