摘要:在当今数字化浪潮汹涌澎湃的时代,计算需求呈爆炸式增长。从高清视频的流畅播放到复杂 3D 游戏的沉浸式体验,从人工智能的深度数据挖掘到 3D 软件模型渲染的模拟运算,传统的计算架构在面对这些海量且复杂的任务时,逐渐显得力不从心。
在当今数字化浪潮汹涌澎湃的时代,计算需求呈爆炸式增长。从高清视频的流畅播放到复杂 3D 游戏的沉浸式体验,从人工智能的深度数据挖掘到 3D 软件模型渲染的模拟运算,传统的计算架构在面对这些海量且复杂的任务时,逐渐显得力不从心。
而此时,GPU(图形处理器)作为一种强大的计算引擎,犹如一颗璀璨的新星,闪耀在计算领域的浩瀚天空,为我们带来前所未有的计算速度与效率提升。
图形处理器(GPU)以其在人工智能、科学研究和沉浸式游戏等不同领域加速计算任务的卓越能力而闻名。与中央处理器(CPU)不同,GPU 由数千个专门为并行处理设计的内核构建,使它们能够同时执行类似的任务。
这种架构使 GPU 对于可以划分为较小任务的计算问题极为高效,比如数千名小黄人完美同步地同时处理多个任务。
在电影《卑鄙的我》中,成千上万个小黄人同时工作,每个人处理一系列任务,同样,GPU内核并行运行,同时在数字时尚行业,基于 GPU 的仿真已成为一项基石技术。它解决了有限计算时间的持续挑战,实现了更快、更准确的模拟,同时提高了保真度和可靠性。从精确的悬垂建模到实时响应,布料模拟的每一个方面都依赖于高效的计算,从而巩固了 GPU 作为推进数字方式所不可或缺的工具。
本文深入探讨了基于 GPU 的布料模拟的关键进展,并展望了其未来,发掘创新机会及其带来的变革性影响。
石器时代
基于 GPU 的布料模拟的早期开发可以追溯到 2006 年 马蒂亚斯·穆勒 及其同事[1] 在 AGEIA 推出的基于位置的动力学 (PBD)。有趣的是 PBD 最初不是为 GPU 设计的,而是为物理处理单元 (PPU) 设计的,PPU 是由半导体公司 AGEIA 开发的专用硬件。2008 年 NVIDIA 收购 AGEIA 后,PBD 成为 NVIDIA PhysX 的核心组件,后来成为 NVIDIA Omniverse Physics Core 的一个不可或缺的功能。
NVIDIA PhysX 是一款多物理运算引擎开发技术,旨在在 GPU 上模拟和建模物理现象。其核心PBD 因其在 GPU 上的效率而备受赞誉,尤其是在小规模问题上,例如顶点相对较少的服装网格。虽然这种效率通常归因于其高并行性,但一个较少讨论的优势是它的简单性。该算法的简约设计允许整个模拟在单个 GPU 线程块中运行,利用共享内存一致性来最大限度地提高性能。
然而,PBD 有一个显著的局限性:它缺乏物理准确性。PBD 不明确定义材料属性,而是依靠迭代次数和混合权重等间接参数来近似材料行为。这对数字时尚应用提出了挑战,因为准确模拟各种面料行为对于实现逼真可靠的结果至关重要。
使用投影动力学 (PD) 模拟的海盗旗示例。即使在极端风力条件下,PD 仍能保持稳定并有效地实时模拟为了解决基于位置的动力学 (PBD) 的局限性,Bouaziz 及其合作者[2]提出了一种称为投影动力学 (PD) 的新方法。
虽然 PD 和 PBD 具有某些相似之处,但它们的主要区别在于更新机制:PBD 按照预定义的顺序依次更新约束或使用固定权重混合它们,而 PD 通过求解全局线性系统来集成多个更新。
这一根本区别使得 PD 在形式上等同于解决基于物理的模拟的隐式时间积分得出的非线性优化问题。因此,PD 的收敛结果复制了传统基于物理的模拟的行为,确保了稳健性和精度。
现代智能
原始 PD 的一个限制在于其设计,它专门针对 CPU 进行了优化。在 PD 发明后不久,王及杨[3]发现 PD 可以重新定义为预条件梯度下降方法。利用这一见解,他们引入了切比雪夫加速,大大提高了预条件梯度下降的效率,从而显著加快了 GPU 上的模拟速度。
使用切比雪夫加速投影动力学模拟的服装示例,在 NVIDIA GeForce GTX 970 卡上以每更重要的是,他们证明了数十年来发展起来的成熟的非线性优化技术可以有效地应用于基于物理的模拟。其中许多方法本质上与并行计算兼容,因此特别适合基于 GPU 的模拟。
与模拟布料动态相比,稳健高效地处理碰撞接触是一项更大的挑战。早期的碰撞处理技术通常是临时性的,依赖于大量连续操作,而这些操作本质上并不适合 GPU 模拟。
在功夫小子身上模拟了多件服装,其中使用唐及同事们[4]提出的 GPU 加速碰撞处理技术来管理激烈的碰最初的研究旨在在 GPU 上并行化其中一些操作,以实现显著的加速。然而,由此产生的碰撞处理方法通常实施起来很复杂,并且在复杂的场景中容易失败。
2020 年,吴及其同事们[5]等引入了一种突破性方法,使用对数屏障函数将碰撞处理集成到优化过程中。李及其同事们[6]等通过增量势接触 (IPC) 框架进一步完善了这一想法,为安全碰撞处理提供了强大的解决方案。此后的研究重点是提高模拟性能而不影响碰撞精度。
现在通过基于 GPU 的尖端模拟技术[7],由数十万个顶点组成的数字服装,在虚拟人物身上实时模拟。随着模拟技术和 GPU 硬件的进步,现代基于 GPU 的模拟引擎,现在能够实现 实时、高分辨率的服装模拟,如图所示。
在 3D 设计软件中
GPU 扮演的核心角色
传统的 3D 设计流程涉及到大量复杂的计算任务,其中包括模型构建、材质纹理映射、光照计算、渲染以及动画模拟等。在早期,这些任务主要依赖于 CPU(中央处理器)来处理。
然而,随着 3D 设计的精度要求不断提高、模型复杂度日益增加以及实时交互性需求的崛起,CPU 串行处理的局限性逐渐显现。
此时,GPU 凭借其独特的架构设计和卓越的并行计算能力,开始在 3D 设计软件中崭露头角并承担起关键角色。GPU 专为处理大规模并行数据而优化,其内部包含了众多的计算核心(通常数以千计),这些核心能够同时对不同的图形数据片段进行独立运算。
在 3D 设计软件中,例如在处理一个包含数百万个多边形的复杂 3D 模型时,GPU 可以将模型的每个多边形分配到不同的计算核心上进行并行处理,如计算多边形的顶点坐标、法向量、颜色信息等。
这种并行处理方式极大地提高了计算速度,相较于 CPU 的串行处理,能够在相同时间内完成数倍甚至数十倍的计算量,从而显著缩短了 3D 设计项目的制作周期。
Style3D 利用GPU
提升建模关键性能
Style3D,利用 GPU 加速,可以轻松实现高真实感布料物理模型、稳定的多层碰撞、复杂的服装工艺模拟、高性能 GPU 求解器,支持布料、柔性人体、刚体模拟等等功能,还能实现多种实用功能,比如自动改版、服装搭配试穿等等。
从应用场景,从面料测量、仿真设计、推款审款、在线改版、视效展示到直连生产,赋能新时代设计师和时尚创造者在研发上建立规范化数字化流程、节省时间、降低成本、避免非必要浪费、实现无限创意。让项目周期缩短,极大程度上提高了企业效率。
Style3D Studio 的最新软件更新,特别是从 6.2 版本到 7.2 版本,带来了显著的未来发展
那么未来会怎样呢?虽然仅仅等待硬件改进来提高性能是一种选择,但仍有三个研究方向值得探索,以进一步突破模拟技术的界限。
首先,改进的计算性能为更好地模拟复杂的织物行为提供了机会,尤其是具有复杂交织图案的针织物的行为。传统上,在纱线层面模拟针织物被认为在计算上是无法承受的。
最近,我和我的同事们[8]探索了使用先进的碰撞处理技术加速针织物模拟的可行性。然而,这一领域仍有很大的研究空间。
使用最先进的基于 GPU 的技术在行走虚拟人身上模拟针织品,证明了曾经被认为计算能力受限的问题的可行最后,通过估算布料的悬垂和变形方式,AI 具有巨大的潜力来增强基于 GPU 的模拟。这种集成可以使模拟器运行得更高效、更准确,最终使模拟在时尚应用中更加实用和有影响力。通过使用数据驱动的方法,我们可以在现实世界场景中开启新的可能性,以更快、更精确地获得结果。
这些方向不仅有望加速该领域的发展,而且还强调了跨学科方法,如何将模拟转变为未来时尚技术的更多功能和更强大的工具。
文章主要来源:
Style3D 首席科学家、世界级图形学专家
王华民博士
[1] 马蒂亚斯·穆勒、布鲁诺·海德堡、马库斯·亨尼克斯、约翰·拉特克利夫 (2006)。基于位置的动力学。VRIPHYS。
[2] Sofien Bouaziz、Sebastian Martin、Tiantian Liu、Ladislav Kavan、Mark Pauly (2014)。投影动力学:融合约束投影实现快速模拟。ACM Trans. Graph。(SIGGRAPH)。
[3]王华民,杨银(2016)。GPU上弹性体模拟的下降方法。ACM Trans. Graph。(SIGGRAPH 亚洲)。
[4] Min Tang、Huamin Wang、Le Tang、Ruofeng Tong、Dinesh Manocha (2016)。CAMA :用于基于 GPU 的布料模拟的具有统一碰撞处理的接触感知矩阵组装。计算机图形学论坛 (Eurographics)。
[5] 吴龙华、吴波涛、杨银、王华民(2020)。基于 GPU 的布料自碰撞的安全快速排斥方法。ACM论文集。
[6] Minchen Li、Zachary Ferguson、Teseo Schneider、Timothy Langlois、Denis Zorin、Daniele Panozzo、Chenfanfu Jiang、Danny M. Kaufman (2020)。增量势接触:无交叉和无反转大变形动力学。ACM Trans. Graph。(SIGGRAPH)。
[7] 兰雷、陆子轩、龙静一、袁春、李旋、何小伟、王华民、姜陈凡富、尹阳(2024)。具有无距离障碍和子空间重用的高效 GPU 布料模拟。ACM 翻译。图形。(SIGGRAPH 亚洲)。
[8] 袁春,施浩阳,兰雷,邱宇兴,Cem Yuksel,王华民,姜陈凡富,吴奎,杨寅(2024)。针织品模拟的体积均质化。ACM 翻译。图形。(SIGGRAPH 亚洲)。
来源:Style3D