上海AI独角兽,连放大招
分化快速显现,零之万物、百川智能相继退出大模型预训练。大模型“六小虎”(月之暗面、智谱AI、MiniMax、阶跃星辰、百川智能、零一万物)的叙事已被瓦解,取而代之的是“基础大模型五强”(DeepSeek、阿里、字节、阶跃星辰、智谱AI)。
分化快速显现,零之万物、百川智能相继退出大模型预训练。大模型“六小虎”(月之暗面、智谱AI、MiniMax、阶跃星辰、百川智能、零一万物)的叙事已被瓦解,取而代之的是“基础大模型五强”(DeepSeek、阿里、字节、阶跃星辰、智谱AI)。
AI领域的创新步伐再次加速,国内知名的AI独角兽企业九章云极,近期隆重推出了其新一代的全栈智能计算云平台——九章智算云Alaya NeW Cloud 2.0,并同步宣布了全球首个强化学习智算服务的正式启动。这一平台的问世,标志着九章云极在智能计算基础设施服务领
在人工智能技术快速演进的背景下,大型语言模型的架构设计始终围绕仅解码器(decoder-only)的Transformer结构展开。自第一个GPT模型发布以来,该架构已成为主流设计范式。尽管研究人员在效率优化方面进行了诸多改进,但核心架构结构保持相对稳定。
大模型训推系统宛如一辆精密调校的赛车,即便搭载顶级引擎(高算力芯片),如果油箱(内存)、变速箱(带宽)与路况(任务类型)不匹配,仍会陷入“龟速”困局。华为研究团队发现,超过60%的算力浪费在硬件资源错配与系统耦合上,而传统“人拉肩扛”的优化方法在芯片特性的“三
在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协同,实现整个系统的效
你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译,甚至帮医生看 CT 片,这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断进化到能处理万亿参数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而
你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。随着人工智能从简单规则判断进化到能处理万亿参数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而
在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协同,实现整个系统的效
随着人工智能从简单规则判断进化到能处理万亿参数的大模型,单台计算机的算力就像小舢板面对汪洋大海,而算力集群则是把上万台甚至几十万台计算机像搭积木一样连接起来,形成一艘能承载巨量计算任务的 "算力航空母舰"。
为持续推动尖端AI模型的创新发展,英特尔始终与业界领先的创新力量保持深度协作。我们欣然宣布,全新升级的英特尔AI解决方案已全面覆盖PC客户端、边缘计算、智能驾舱等场景,在第一时间为Qwen3系列大模型的发布提供技术支撑。
小红书意外成为开源大模型领域的先锋,推出首个自研模型dots.llm1,引发技术界热议。小红书这个以分享生活方式和美容心得为主的社交媒体平台,近期却在技术圈掀起了不小的波澜。其人文智能实验室团队自主研发的首个大模型dots.llm1正式开源,打破了外界对小红书
Kimi-VL 项目是 Kimi Team 于 2025 年 4 月发布的大语言模型,这是一种高效的开源专家混合 (MoE) 视觉语言模型 (VLM),可提供高级多模态推理、长上下文理解和强大的代理功能。相关论文成果为「Kimi-VL Technical Re
在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的Pangu Pro MoE 72B模型,大幅降低计算开销,并在SuperCLUE千亿内模型并列国内第一。通过系统级
在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的Pangu Pro MoE 72B模型,大幅降低计算开销,并在SuperCLUE千亿内模型并列国内第一。通过系统级
如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊病,还能够降本增效,便于训练和部署。
在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的Pangu Pro MoE 72B模型,大幅降低计算开销,并在SuperCLUE千亿内模型并列国内第一。通过系统级
在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径。华为团队重磅推出昇腾平台原生设计的 Pangu Pro MoE 72B模型,大幅降低计算开销,并在SuperCLUE千亿内模型并列国内第一。
2025年,人工智能技术迭代升级,DeepSeek以MoE混合架构与动态训练算法,实现大模型性能与能效比指数级提升,开启“普惠智能”新纪元。其开源生态深度构建,将智能能力以标准化API、行业解决方案等形态注入千行百业,重塑行业规则,推动AI深度渗透产品创新、用
“ Pangu Ultra MoE 的每一项突破,都体现了华为在AI底层技术与工程化落地中的领先实力。”
三分之一个世纪前,加拿大学者们提出了经典的MoE模型神经网络结构,在人类探索AI的「石器时代」中,为后世留下了变革的火种。