摘要:Stability AI 发布了新版 Stable Diffusion3.5Large,新增三种 ControlNet 功能,分别是Blur、Canny和Depth,显著提升了图像生成能力。用户可在不商业化的前提下免费使用该模型,尤其是年收入低于100万美元的
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、震撼来袭!Stability AI的SD3.5L新增三大 ControlNet功能 生图能力再升级
Stability AI 发布了新版 Stable Diffusion3.5Large,新增三种 ControlNet 功能,分别是Blur、Canny和Depth,显著提升了图像生成能力。用户可在不商业化的前提下免费使用该模型,尤其是年收入低于100万美元的小型企业和创作者也可享受商业用途的免费使用权。
【AiBase提要:】
🌟 新增三种 ControlNet 功能:Blur、Canny和Depth,提升图像生成能力。
💼 免费使用协议:个人和年收入低于100万美元的企业可免费使用模型。
🔒 强调安全性:Stability AI 采取措施,防止模型被滥用。
详情链接:https://stability.ai/news/sd3-5-large-controlnets
2、Kimi内测AI视频生成功能:每天免费100秒创作空间
人工智能聊天工具Kimi正在内测其创新的AI视频生成服务——Kimi创作空间,目前处于灰度测试阶段,旨在为用户提供全新的创意表达方式。用户可以利用12种预设风格模板和自定义创作功能,制作个性化的音乐视频,每天还可免费生成100秒的视频。
【AiBase提要:】
🎨 Kimi创作空间提供12种预设风格和自定义功能,让用户自由创作个性化视频。
🎶 用户每天可免费生成100秒的视频,极大地提升了创作的灵活性。
💡 该功能支持详细描述视频场景,为创意表达提供更多可能性,推动AI视频生成技术的发展。
3、跨界无限!智谱AI发布AutoGLM升级版,一句话操控全网APP
智谱AI近期发布了AutoGLM的多个升级版本,包括浏览器版和电脑版,展现出强大的跨APP操作能力。用户只需一句话即可在多个应用间自由切换和操作,极大提升了效率。
【AiBase提要:】
⚡ 跨APP操作能力:用户只需一句话即可在多个应用间进行操作,极大提升了使用效率。
🖥️ GLM-PC语音操控:通过语音指令直接操控电脑,简化工作流程,成为打工人的救星。
🌟 AutoGLM全能助手:支持主流APP,用户可以轻松完成点餐、搜索等任务,展现出AI的智能化和灵活性。
4、特斯拉 “Optimus ” 机器人升级:手部设计更灵巧、更敏感!
特斯拉公司对其人形机器人“Optimus”进行了重大的手部设计升级,新增22个自由度和柔软的保护层,提升了机器人的灵活性和触觉感应能力。这一创新将为机器人在家庭、医疗和工业等领域的应用提供更多可能性,展示了特斯拉在机器人技术领域的持续探索。
【AiBase提要:】
🤖 新手部设计具备22个自由度,提升操作灵活性和精准度。
🛡️ 新增的保护层增强触觉感应能力,安全处理精细物品。
⚙️ 所有驱动器集成于前臂,计划年底前完成传感器整合并减轻重量。
5、亚马逊开发新型多模态语言模型 “Olympus” 或将亮相 AWS 大会
亚马逊正在开发一种名为“Olympus”的多模态大型语言模型,预计将在下周的AWS re:Invent大会上发布。该模型不仅能处理文本,还能处理图像和视频,具有广泛的应用潜力。
【AiBase提要:】
💡 新模型“Olympus”将处理文本、图像和视频,支持自然语言搜索特定视频片段。
🚀 该模型预计将在下周的AWS re:Invent大会上正式发布,可能作为AWS Bedrock的一部分。
🔧 亚马逊的AI战略不仅包括软件,还涉及硬件开发,推出了针对训练和推理的专用芯片系列。
6、Rhymes AI推出革命性文本图像视频生成模型Allegro-TI2V
Rhymes AI最近推出的Allegro-TI2V模型,标志着文本到视频生成技术的重大进步。该模型不仅支持高达79.2K的上下文长度和720×1280的输出分辨率,还具备高效的视频生成能力,能够满足创作者在电影、游戏和数字艺术等领域的需求。
【AiBase提要:】
🚀 Allegro-TI2V支持高达79.2K的上下文长度和720×1280的分辨率,视频生成速度可达每秒15帧。
🎨 该模型引入了后续视频生成和中间视频生成两种新模式,极大提升了视频创作的灵活性与效率。
💻 Rhymes AI在Apache2.0许可下发布Allegro-TI2V,用户可通过简单安装快速上手,应用前景广泛。
详情链接:https://huggingface.co/rhymes-ai/Allegro-TI2V
7、恐怖如斯!AI只需两小时访谈,完美复刻一个人个性、85%准确率!
近期,研究团队与谷歌DeepMind合作,开发出一种新型AI应用,能够在仅两小时的访谈后生成个性模拟,准确率高达85%。这一技术基于ChatGPT大语言模型,通过提问和记录参与者的回答,深入了解个性特征。
【AiBase提要:】
🔍 AI模型在两小时访谈后生成个性模拟,准确率达到85%。
💡 该技术旨在降低社会学研究的成本与时间,提高调查的有效性和广泛性。
🤖 模拟的个性被称为“代理人”,未来可能改善工作助手及个人机器人的人机互动体验。
详情链接:https://techxplore.com/journals/arxiv/
8、谷东科技发布双目全彩AI+AR眼镜:无感佩戴+高清镜头
谷东科技推出的Star1和Star1S眼镜代表了AI与AR技术的完美结合,提供了全彩显示和强大的AI功能。这些眼镜不仅在设计上考虑了佩戴舒适度,还在技术上实现了高清画质和多模态AI系统的应用。Star1S作为业内首款全彩双目阵列光波导AR眼镜,预计将于12月上市。
【AiBase提要:】
🖼️ Star1S是首款全彩双目阵列光波导AR眼镜,提供更高的佩戴舒适度和画面清晰度。
🤖 搭载多模态AI系统,Star1S在多种环境下实现全天候长续航,满足不同场景需求。
📱 支持与主流应用兼容,用户可通过眼镜直接接打电话、观看视频,功能接近智能手机。
9.ChatGPT 诞生两周年,用户数突破2亿
ChatGPT 自2022年推出以来,经历了快速发展,成为日常生活中不可或缺的数字工具。用户在短时间内激增,现已超过2亿,每月访问量达到31亿。新版本 GPT-4o 和搜索功能的推出,提升了用户体验,但仍存在信息准确性和伦理问题。OpenAI 正在努力解决这些挑战,以进一步优化其服务和用户信任。
【AiBase 提要:】
🌐 ChatGPT 用户数在两年内激增,成为家庭中重要的数字助手。
🔍 新推出的搜索功能改善了信息获取方式,挑战传统搜索引擎。
⚖️ ChatGPT 仍面临信息准确性和伦理问题,需进一步提升解决方案。
10、超速崛起!xAI仅用1年多就达到了500亿美元的估值
埃隆·马斯克的人工智能公司xAI在短短16个月内达到了500亿美元的估值,超越了许多竞争对手。与OpenAI相比,xAI的迅速崛起展示了其在AI领域的强大潜力和市场吸引力。公司通过融资和技术创新,尤其是超级计算机的建设,进一步巩固了其在行业中的地位。
【AiBase提要:】
🚀 xAI在成立16个月内达到了500亿美元的估值,超越了多家竞争对手。
💰 近期完成了50亿美元的融资,用于购买NVIDIA芯片,支持超级计算机建设。
🤖 聊天机器人Grok成为市场强劲竞争者,通过社交媒体训练提升其响应能力。
来源:站长之家一点号