AI日报:美团已开发内部大模型LongCat;vivo成立机器人LAB独立中心;腾讯发布混元T1正式版

360影视 日韩动漫 2025-03-25 00:27 3

摘要:阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破,利用多模态变换器架构和头部特征金字塔编码方案,显著提高了重建精度和效率。该技术能够从单个图像快速生成动画化的3D人体模型,且无需复杂的后期处理,展现出优越的泛化能力,适应不同场景和光照条件,推动了该领

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、阿里通义实验室LHM技术实现从单图像的快速3D 人体重建与动画生成

阿里通义实验室的LHM技术在3D人体重建领域取得了重要突破,利用多模态变换器架构和头部特征金字塔编码方案,显著提高了重建精度和效率。该技术能够从单个图像快速生成动画化的3D人体模型,且无需复杂的后期处理,展现出优越的泛化能力,适应不同场景和光照条件,推动了该领域的应用前景。

【AiBase提要:】

🛠️ LHM模型通过多模态变换器架构,有效编码人体位置和图像特征,实现高精度的3D重建。

👤 头部特征金字塔编码方案增强了对头部细节的捕捉,使生成的模型更加逼真。

⏱️ LHM技术在几秒钟内生成动画人体,显著节省时间和人力成本,适用于实际应用。

详情链接:https://lingtengqiu.github.io/LHM/

2、腾讯发布混元 - T1正式版,推理能力大幅提升

腾讯最近正式推出了混元 - T1,这款新模型在推理能力上有了显著提升,特别是在深度思考和复杂问题解决方面表现优异。基于行业领先的TurboS底座,混元 - T1通过大规模后训练,解决了长文本推理中的上下文丢失问题,并在计算资源消耗上进行了优化。

【AiBase提要:】

⚡ 混元 - T1基于TurboS底座,推理能力显著增强,尤其在深度思考方面表现突出。

📊 经过大规模后训练,模型在解码速度上达到了两倍提升,同时优化了计算资源的消耗。

🧠 团队专注于强化学习,收集了大量理科难题,确保模型在多领域推理任务中展现卓越表现。

详情链接:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1

3、手机巨头进军机器人赛道,vivo 机器人 LAB 正式成立

vivo 最近成立了专注于家庭机器人研发的实验室,标志着其在机器人领域的进一步探索。公司高层表示,vivo 在人形机器人领域具备独特的技术优势,尤其是在智能算法和混合现实技术方面。未来,vivo 计划利用这些技术解决行业中的技术难点,并在医疗和养老等领域应用机器人,以应对人力资源短缺的挑战。

【AiBase提要:】

🤖 vivo 成立机器人 LAB,专注于家庭机器人研发,标志着其在机器人领域的探索。

🧠 胡柏山表示,人形机器人是未来可能切入的行业,vivo 在智能算法和混合现实技术方面具备优势。

🏥 机器人在医疗和养老等领域的应用,旨在缓解人力资源紧缺的问题,体现企业社会责任。

4、王兴:美团已开发内部大模型LongCat 投资数十亿元GPU资源

美团在2024年全年实现了3376亿元人民币的营收,增长22%。CEO王兴在业绩发布会上阐述了美团在人工智能领域的战略,包括对AI基础设施的投资和大模型Longcat的研发。美团计划将AI技术广泛应用于员工工作流程和产品升级,提升运营效率。

【AiBase提要:】

💰 美团2024年营收达到3376亿元,同比增长22%,展现出稳健的增长动力。

🧠 CEO王兴透露,美团将加大对AI基础设施的投资,计划在2025年进一步强化AI布局。

🚚 自动配送领域的进展显著,完成491万单配送任务,并在全球范围内拓展商业化运营。

5、苹果重组AI高管团队,Siri升级推迟至2026年

苹果公司近期对其高管团队进行了重大调整,旨在提升人工智能战略的执行力,尤其是针对其语音助手Siri的项目。由于研发进展滞后,原定于今年推出的升级计划被推迟至2026年,反映出苹果在面对竞争压力时的紧迫感。新任命的Siri项目负责人迈克·洛克威尔将直接向软件工程主管汇报,标志着苹果在AI领域的重大调整。

【AiBase提要:】

🔍 苹果对高管团队进行重组,以提升人工智能战略的执行力。

📅 Siri多项升级计划已被推迟至2026年,显示出研发进展的滞后。

👔 迈克·洛克威尔接替前负责人,标志着苹果在AI领域的重大调整。

6、谷歌推Gemini实时AI视频功能,手机摄像头实时解读画面内容

谷歌最近推出了Gemini Live的新功能,使其能够通过手机摄像头实时回答用户的问题。这一创新是在近一年的研发后首次面世,用户在小米手机上已经体验到了这一功能,并分享了演示视频。此次更新不仅增强了谷歌在智能助手市场的竞争力,也为用户提供了更加智能和便捷的互动体验,显示了AI技术的进步和应用潜力。

【AiBase提要:】

🌟 谷歌 Gemini Live 推出新 AI 功能,能够通过手机摄像头实时回答用户问题。

📱 用户在小米手机上已体验到新功能,并发布了相关演示视频。

🚀 此次更新进一步巩固谷歌在智能助手市场的领先地位。

7、新一代AI图像生成模型Reve Image震撼登场,引领创作新潮流

Reve Image是一款全新的AI图像生成模型,专注于提升美学表现和提示遵循能力,旨在为用户提供高质量的视觉创作体验。该模型展现出强烈的设计感,生成的作品简洁大气,具有海报风格的视觉冲击力。用户反馈其生成能力已足以媲美市场领先技术,且平台设计友好,操作流畅。

【AiBase提要:】

✨ Reve Image专注于提升美学表现和提示遵循能力,提供高质量视觉创作体验。

🖼️ 该模型生成的作品简洁大气,展现出强烈的设计感,具有海报风格的视觉冲击力。

💻 平台界面友好,操作流畅,已开放免费使用,吸引大量创作者尝试。

详情链接:https://top.aibase.com/tool/reve

8、全球首个体重管理AI大模型 “减单” 在合肥发布

在合肥发布的全球首个体重管理AI大模型“减单”,是由安徽医科大学、中国科学技术大学附属第一医院与浙江诺特健康科技股份有限公司共同研发的,旨在帮助超重和肥胖患者有效管理体重。当前中国成人超重率已达34.3%,预计2030年将飙升至70.5%。

【AiBase提要:】

🌍 全球首个体重管理AI大模型“减单”在合肥发布,旨在应对肥胖问题。

📈 当前中国成人超重率达到34.3%,预计到2030年将飙升至70.5%。

🤖 “减单”模型结合多种数据,能智能分析饮食情况,帮助用户健康管理体重。

9、开源实时识别模型RF-DETR:实时识别画面中的物体,开源可商用

RF-DETR是由Roboflow团队开发的一款开源实时目标检测模型,旨在解决YOLO系列模型在速度和精度上的不足。它在COCO数据集上实现了超过60%的平均精度,并且在GPU上具备极低的延迟,适用于自动驾驶、工业质检等需要快速反应的场景。

【AiBase提要:】

⚡ RF-DETR是开源的实时目标检测模型,速度和精度超越YOLO系列。

📊 在COCO数据集上,RF-DETR实现了超过60%的平均精度,展现出强大的性能。

🔧 支持多分辨率训练,开发者可灵活调整模型以平衡精度和延迟。

详情链接:https://top.aibase.com/tool/rf-detr

10、Cloudflare 推出 “AI 迷宫”,引导恶意爬虫走入虚假数据陷阱

Cloudflare 最新推出的 “AI Labyrinth” 工具旨在通过引导恶意网络爬虫进入 AI 生成的虚假页面,来有效打击未经授权的数据抓取行为。这一创新措施不仅可以拖延和迷惑爬虫,还能帮助网站管理员识别新的爬虫模式。通过这种主动出击的方式,Cloudflare 希望减少爬虫对网站的影响,并为未来构建更复杂的虚假数据网络奠定基础。

【AiBase提要:】

🛡️ AI Labyrinth 通过生成虚假页面来引导恶意爬虫,浪费其资源。

📊 网站管理员可在 Cloudflare 仪表板上启用此功能,未来还将扩展为更复杂的链接网络。

🔍 该工具帮助识别恶意爬虫,并了解新出现的爬虫模式和特征。

详情链接:https://blog.cloudflare.com/ai-labyrinth/

11、AbletonMCP :调用Ableton的MCP服务,让Claude能够创作音乐

AbletonMCP 是一款创新工具,通过模型上下文协议将音乐制作软件 Ableton Live 与 Claude AI 连接,提供了一种全新的音乐创作体验。该系统由 Ableton 远程脚本和 MCP 服务器组成,用户可以通过 Claude 与 Ableton 进行互动,执行各种音乐制作指令。

【AiBase提要:】

🎛️ AbletonMCP 将 Ableton Live 与 Claude AI 连接,实现音乐创作的新方式。

🛠️ 系统由 Ableton 远程脚本和 MCP 服务器两部分组成,支持多种音轨和剪辑操作。

💻 用户通过 Claude 与 Ableton 互动,执行指令以控制音乐制作流程。

详情链接:https://top.aibase.com/tool/abletonmcp

来源:站长之家

相关推荐