摘要:太平洋西北国家实验室 (PNNL) 的研究人员正在开发一种名为 Picasso 的算法,专门用于这项任务。据 PNNL 称,该代码在IEEE 并行和分布式处理国际研讨会上发表后,最近发布在GitHub上。该算法将量子准备工作的一个关键环节缩短了 85%。
量子计算在计算化学和高速网络等领域拥有巨大的潜力。但它们与传统的高性能计算系统截然不同,科学家们正在研究如何为它们提供量子数据。
太平洋西北国家实验室 (PNNL) 的研究人员正在开发一种名为 Picasso 的算法,专门用于这项任务。据 PNNL 称,该代码在IEEE 并行和分布式处理国际研讨会上发表后,最近发布在GitHub上。该算法将量子准备工作的一个关键环节缩短了 85%。
虽然该团队 之前已经演示过这项技术,但 PNNL 表示,最新研究解决了与扩展相关的瓶颈,并且对于比现有工具大 50 倍的问题也有效。
“量子计算可以极其快速高效,但必须解决潜在的瓶颈问题。目前,为量子系统准备信息是阻碍我们前进的一个因素,”该论文作者、 西北太平洋国家实验室人工智能中心领导团队成员 Mahantesh Halappanavar 表示。“这是一种将问题打包的新方法,以便量子计算机能够高效地处理它。”
这项工作的贡献者包括:SM Ferdous,一位拥有高性能计算 (HPC) 背景的数据科学家,也是本文的第一作者;Bo Peng,一位量子计算研究员;以及 Reece Neff,一位北卡罗来纳州立大学的研究生,同时也是西北太平洋国家实验室 (PNNL) 杰出研究生项目研究员,也是该项目的首席软件开发人员。Ferdous 是现任 Linus Pauling 杰出博士后研究员,Peng 曾是西北太平洋国家实验室的 Pauling 研究员。
PNNL 的 SM Ferdous
其他作者包括机器学习专家 Salman Shuvo 和 Sayak Mukherjee、高性能计算专家 Marco Minutoli、实验室研究员兼量子计算专家 Karol Kowalski、北卡罗来纳州立大学的 Michela Becchi 和 Halappanavar。
对于量子计算来说,围绕数据的幕后操作必须高效运行,量子计算机才能发挥其潜力。
“量子计算并非即插即用,”彭说。“你需要以某种方式准备输入,以便量子计算机能够理解并与之交互。我们的算法是一种高效混合计算的工具,我们使用经典计算来准备用于量子计算的量子数据。”
毕加索:精简数据
为了减轻计算负担,PNNL团队采用了一种名为“图着色”的算法——这是 Ferdous 和 Halappanavar 的专长。这种方法允许研究人员探索网络中的关系,并对相似或不同的术语进行排序。目标是将所有关系划分成尽可能少的组。
PNNL 算法被命名为毕加索——这是对画家对色彩的运用以及图形分析中术语的使用的致敬。
该团队在大型氢模型系统的模拟中测试了图形着色,这些系统是复杂的试验台——简单的化学成分需要快速准备量子数据,这需要数万亿次计算。
该团队测试的一些氢系统产生了超过200万个量子元素,即泡利弦,这意味着经典计算机需要追踪超过一万亿个关系。目前的工具通常仅限于包含数万个泡利弦的系统。
PNNL 团队通过开发新的图形分析方法对 Pauli 运算进行分组,从而大幅减轻了计算负担,将计算中涉及的 Pauli 字符串数量减少了约 85%。总而言之,该算法在 15 分钟内解决了包含 200 万个 Pauli 字符串和超过一万亿个关系的问题。与其他方法相比,该团队的算法可以处理来自 Pauli 字符串(顶点)近 50 倍的输入,以及超过 2400 倍的关系(边)。
科学家们通过一种名为“团块划分”(clique parting)的技术减少了计算负荷。该团队并非将所有可用数据都拉到每个计算阶段,而是通过将相似的数据分类到不同的组(称为“团块”)中,用更少的数据来指导计算。其目标是将所有数据分类到尽可能少的团块中,同时仍然确保计算的准确性。
“从高性能计算的角度来看,这类问题实际上表现为团划分问题,”费尔多斯说。“我们可以使用图形分析来表示海量数据,并减少必要的计算。”
稀疏化
研究人员表示,系统规模扩大的障碍在于内存消耗。
“泡利弦及其关系很快就会耗尽内存,限制了可解决问题的规模,”费尔多斯说,“毕加索使用流媒体和随机化等现代工具,避免了对所有原始数据进行操作。”
PNNL团队的研究工作建立在其他研究人员于2019年提出的“调色板稀疏化定理”的基础之上。PNNL团队并没有在模拟中涵盖所有因素之间的关系,而是利用一个稀疏得多的数据集(约占总数据集的十分之一)来进行精确计算。主数据图展示了所有因素之间的关系,而该团队补充的“稀疏”图仅显示了科学家所说的数据中的冲突。仅凭这些冲突就足以提供进行精确计算所需的数据。
“你可以留出大量数据,并且仍然可以获得准确的结果,而且只使用更少的内存,”Ferdous 说道。
Halappanavar 补充道:“这就像打包搬家一样。你希望搬运的箱子数量最少。你必须高效地打包。”
研究人员认为,Picasso 可以扩展以解决更大的问题,包括需要 100 到 1,000 个量子比特的系统——量子计算的前沿。
该团队还开发了一种人工智能算法,帮助用户计算计算中使用的数据量和所需内存量之间的最佳权衡。
这项工作由太平洋西北国家实验室 (PNNL) 和美国能源部科学办公室资助。
来源:酷奇科学