张量资讯_360影视

万亿并发级别！大模型主流运行框架技术和生产级配置最佳实践！

在当今数字化时代，大模型已成为推动人工智能发展的核心力量。从自然语言处理到计算机视觉，从智能客服到智能驾驶，大模型的应用无处不在。然而，随着模型规模和复杂度的不断增加，如何实现万亿并发级别的高效运行，成为了业界面临的重大挑战。本文将深入探讨大模型主流运行框架技

模型张量配置推荐系统 parallelism 2025-06-28 20:24 5

台积电2nm客户盘点，3万美金一片谁在买？

去年下半年开始，业界盛传台积电2nm晶圆单片价格超过30,000 美元，下一代技术节点甚至可能高达45,000 美元，这反映了当今最先进的半导体技术背后惊人的复杂性和投资。据说，单款芯片的总开发成本高达725M+（美金）。那么，到底是哪些客户在花重金买2nm？

张量台积电台积电2nm 2nm 2nm客户 2025-06-27 14:59 3

麒麟软件申请提升大模型推理长度与性能方法等专利，降低注意力机制计算复杂度

国家知识产权局信息显示，麒麟软件有限公司申请一项名为“一种提升大模型推理长度与性能的方法、系统及介质”的专利，公开号CN120197699A，申请日期为2025年03月。

软件模型推理张量专利 2025-06-25 10:02 5

京东“618”整体订单量超22亿单；月之暗面Kimi首个Agent开始灰度测试｜一周未来商业

唯品会营销副总裁冯佳路因涉嫌个人经济问题正在配合公安机关调查。据红星资本局报道，唯品会表示，对贪腐行为零容忍，目前公司业务运营一切正常。知情人士称，冯佳路在唯品会负责品牌营销等工作。

京东张量 agent kimi 订单量 2025-06-23 06:32 5

量子计算创企Multiverse Computing获2.15亿美元B轮融资

本周，量子计算创企Multiverse Computing宣布完成2.15亿美元B轮融资。本次融资由Bullhound Capital领投，HP Tech Ventures、SETT及Forgepoint Capital International等机构跟投。

张量融资 computing multiverse san 2025-06-18 09:33 4

首发 | 记忆张量获近亿元天使轮投资，专注于基本原理驱动的系统性创新

记忆张量（上海）科技有限公司（以下简称“记忆张量”）近日宣布完成近亿元天使轮融资，本轮融资由孚腾资本、算丰信息、中金资本等知名机构共同投资，云岫资本担任独家财务顾问。成立于2024年11月的记忆张量，专注于基本原理驱动的系统性创新，以“低成本、低幻觉、高泛化”

创新记忆张量天使鄂维南 2025-06-18 08:00 3

独家｜魔术背后：张量如何驱动变换器（Transformer）

变换器改变了人工智能在语言理解和数据学习等方面的工作方式，大语言模型的核心是张量（一种帮助处理信息的通用数学矩阵）。当数据通过变换器的不同部分时，张量会发生不同的变换，从而帮助模型理解句子或图像等内容。了解变换器中的张量是如何工作的，有助于理解当今最智能的人工

魔术张量 transformer 解码器变换器 2025-06-10 07:08 6

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

至于原因嘛，让该公司自家的 ChatGPT 来说吧：「截至目前，OpenAI 在 2025 年在 arXiv 上公开发布的论文数量相对较少，可能反映了其对研究成果公开策略的谨慎态度，可能出于商业保密或安全考虑。」

论文 openai 张量 triton 矩阵乘法 2025-06-05 11:02 6

TIM 2025 | 通过残差特征聚合模块的双分支知识蒸馏用于异常分割

本文通过提高模型表示的多样性来解决异常响应消失的问题。本文提出的双分支知识蒸馏（DBKD）模型中的多尺度输入重建分支通过恢复输入的多尺度表示来提高其表示能力。

张量残差卷积余弦残差特征 2025-06-04 07:08 7

全球表示论为何颠覆传统数学认知

2025年5月27日，一篇题为《Global representation theory: Homological foundations》的arXiv预印本论文引发了数学界广泛关注。这项研究通过构建阿贝尔范畴，首次将经典表示论与一般线性群的VI-模范畴统一于

数学投影张量同伦代数学 2025-05-29 21:30 7

长程相互作用中热面积律的突破

量子多体问题是现代物理学中一项艰巨的挑战，旨在揭示大量相互作用粒子的集体行为。其核心在于量子关联和纠缠的复杂图景，这些基本特性超越了经典直觉。在这些关联中，一个最深刻的见解是“面积律”（Area Law），它深刻地塑造了我们对量子信息分布的理解以及各种计算方法

张量热力学中热面积律中热面积律 2025-05-27 12:00 6

标量曲率，一切几何内容的“语法根源”，理解“什么是弯曲”关键

设想你站在一块看不见边缘的表面上，它可能是平坦的，也可能是曲折的。在不动的前提下，你试图理解脚下这片空间的结构。你不能飞起来鸟瞰，也无法拉直它——但你可以在原地画一个圆。用一根细杆当做笔尖，从你所在的位置向四周“走出去”，始终保持相同的距离，在各个方向上勾勒出

张量语法几何黎曼标量 2025-05-25 13:25 9

DeepSpeed v0.16.9重磅发布！解锁全新性能优化与多项关键功能，深

作为大规模分布式深度学习训练框架的领先者，DeepSpeed持续为AI研发者带来卓越的性能提升和强大功能支持。2025年5月23日，DeepSpeed正式发布v0.16.9版本，此次更新不仅修复了多个关键问题，还引入了多项重要优化和新特性，进一步提升了训练效率

解锁张量显存可执行文件 deepspeed 2025-05-24 19:21 6

开放系统如何驱动 AI 性能

当 Wang 讨论大语言模型 (LLM) 性能时，对话迅速从市场炒作转向技术热图、GPU 优化、网络瓶颈以及编译器的复杂细节。如果讲编译器故障和 TensorRT 错误日志感觉枯燥乏味，那就等着看 Wang 如何把这些日志变成笑话。

开源张量 llama wang centml 2025-05-22 23:25 6

大模型推理，不再是“一根筋”

然而主流的MoE架构大模型，却苦于其结构上的“先天不足”：巨大的硬件成本与多重拖累效率的环节，使得中国企业在这场芯片堆砌与效率挖掘的苦径上难以提速。

模型推理张量 moe allreduce 2025-05-22 20:29 9

如何计算杨氏模量、泊松比、剪切模量？

弹性性质包括杨氏模量、泊松比和剪切模量，量化材料抗形变能力。DFT通过弹性张量（Cij）计算单晶力学参数，结合Voigt-Hill平均法预测多晶模量，误差

张量 gpa 泊松比杨氏模量剪切模量 2025-05-22 16:45 6

黄仁勋宣布个人AI计算机已全面投产

5月19日，英伟达CEO黄仁勋表示，个人AI计算机DGX Spark已全面投产，将于数周内就绪。DGX Spark搭载英伟达GB10超级芯片及张量核心。还推出DGX Station工作站，预计华硕、戴尔、惠普今年晚些时候将推出DGX Station工作站。

英伟达计算机张量黄仁勋物理引擎 2025-05-20 15:13 7

高效处理多维数组：einsum()函数从入门到精通

对于许多数据科学家和开发者而言，einsum通常被视为numpy文档中那个晦涩难懂的高级函数——功能强大但难以理解。不过一旦掌握其基本原理，einsum将成为Python科学计算生态系统中处理多维数组运算最为优雅高效的工具之一。它不仅语法简洁，表达力强，而且在

张量数组函数矩阵乘法 einsum 2025-05-20 10:07 9

深入解析torch.compile：提升PyTorch模型性能、高效解决常见问题

近年来，PyTorch已在学术界和工业界稳固了其作为主流深度学习框架的地位。随着PyTorch 2.0的发布，其核心功能之一torch.compile为用户提供了显著的性能优化能力。本文将从实用角度出发，介绍一些torch.compile的核心技巧，以提升日常

模型微分张量 pytorch pytorch模型 2025-05-17 09:33 6

电磁场张量在相对论电动力学中的作用

电磁场是描述电磁相互作用的基本物理场，它不仅仅局限于传统的电场和磁场的概念，而是通过电磁场张量这一数学工具在相对论框架下得到了更加统一和精确的描述。电磁场张量的引入，解决了在相对论框架下如何处理电场和磁场问题的难题，使得电磁学和特殊相对论能够更加自然地结合。电

张量相对论电磁场电动力学相对论电动力学 2025-05-14 17:48 9