moe

上海AI独角兽,连放大招

分化快速显现,零之万物、百川智能相继退出大模型预训练。大模型“六小虎”(月之暗面、智谱AI、MiniMax、阶跃星辰、百川智能、零一万物)的叙事已被瓦解,取而代之的是“基础大模型五强”(DeepSeek、阿里、字节、阶跃星辰、智谱AI)。

独角兽 agent 财经天下 moe 闫俊杰 2025-06-25 16:31  4

昇腾“数字化风洞”问世:让AI算力配置从经验驱动迈向建模驱动

大模型训推系统宛如一辆精密调校的赛车,即便搭载顶级引擎(高算力芯片),如果油箱(内存)、变速箱(带宽)与路况(任务类型)不匹配,仍会陷入“龟速”困局。华为研究团队发现,超过60%的算力浪费在硬件资源错配与系统耦合上,而传统“人拉肩扛”的优化方法在芯片特性的“三

配置 moe 建模 风洞 马尔科夫 2025-06-11 18:20  5

训推大模型,为何应该先彩排?

在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协同,实现整个系统的效

模型 推理 moe 集群 马尔科夫 2025-06-11 18:16  5

华为如何驯服AI算力「巨兽」?

在过去的十余年时间里,各项单点技术飞速演进,但随着单点技术演进的边际效应递减和系统复杂度的提升,系统性能的天花板逐步从单点技术的上限演变成系统工程上限:单点优势越来越像是精致的零件,提升空间有限;但采用系统工程创新,各个部分完美配合、高效协同,实现整个系统的效

华为 moe 集群 巨兽 马尔科夫 2025-06-09 20:37  6

英特尔第一时间适配Qwen3,AI PC未来已来?

为持续推动尖端AI模型的创新发展,英特尔始终与业界领先的创新力量保持深度协作。我们欣然宣布,全新升级的英特尔AI解决方案已全面覆盖PC客户端、边缘计算、智能驾舱等场景,在第一时间为Qwen3系列大模型的发布提供技术支撑。

ultra 英特尔 moe npu qwen3 2025-06-08 10:27  5

红袖添香,自研新模

小红书意外成为开源大模型领域的先锋,推出首个自研模型dots.llm1,引发技术界热议。小红书这个以分享生活方式和美容心得为主的社交媒体平台,近期却在技术圈掀起了不小的波澜。其人文智能实验室团队自主研发的首个大模型dots.llm1正式开源,打破了外界对小红书

模型 开源 moe 技术圈 技术界热议 2025-06-08 17:33  12

大模型推理,得讲性价比

如今,后发优势再一次来到了大洋此岸,以华为为代表的中国科技企业,纷纷提出对MoE架构的优化重组方案。尤其是华为的MoGE架构,不仅克服了MoE负载不均衡及效率瓶颈的弊病,还能够降本增效,便于训练和部署。

模型 性价比 推理 moe moe模型 2025-06-06 18:39  3

2025从DeepSeek到品牌跃迁AI之于品牌的机遇与挑战

2025年,人工智能技术迭代升级,DeepSeek以MoE混合架构与动态训练算法,实现大模型性能与能效比指数级提升,开启“普惠智能”新纪元。其开源生态深度构建,将智能能力以标准化API、行业解决方案等形态注入千行百业,重塑行业规则,推动AI深度渗透产品创新、用

模型 品牌 开源 deepseek moe 2025-06-06 14:11  6