几十行PyTorch代码让GPU利用率猛涨,MIT团队打造新模型架构
仅需几十行 PyTorch 代码即可大幅提高 GPU 利用率,在英伟达 A100 上的 GPU 利用率高达 70%。这一能力由一款名为 LaCT 的新模型架构实现,它由北京大学本科校友、美国麻省理工学院博士生张天远和所在团队打造。
仅需几十行 PyTorch 代码即可大幅提高 GPU 利用率,在英伟达 A100 上的 GPU 利用率高达 70%。这一能力由一款名为 LaCT 的新模型架构实现,它由北京大学本科校友、美国麻省理工学院博士生张天远和所在团队打造。
扩散模型(Diffusion Models)和流匹配(Flow Matching)是用于生成高质量、连贯性强的高分辨率数据(如图像和机器人轨迹)的先进技术。在图像生成领域,扩散模型的代表性应用是Stable Diffusion,该技术已成功迁移至机器人学领域,