昇腾杀手锏FlashComm,让模型推理单车道变多车道
大语言模型(Large Language Models, LLMs) 自从其问世以来,便迅速成为全球科技领域乃至整个社会的焦点。根据Scaling law,大语言模型的能力与其参数量的对数正相关,因此大语言模型的参数规模也在指数级增长。随之而来的,是大语言模型
大语言模型(Large Language Models, LLMs) 自从其问世以来,便迅速成为全球科技领域乃至整个社会的焦点。根据Scaling law,大语言模型的能力与其参数量的对数正相关,因此大语言模型的参数规模也在指数级增长。随之而来的,是大语言模型
FlashComm1: 大模型推理中的 AllReduce 通信优化技术 。将 AllReduce 基于通信原理进行拆解,并结合后续计算模块进行协同优化,推理性能提升 26%。FlashComm2:大模型推理中以存换传的通信优化技术 。在保持计算语义等价的前提
模型 推理 华 flashcomm 杀手锏flashcomm 2025-05-22 14:38 3