摘要:VISION的系统架构概览 | 来源:Mathur, S., van der Vleuten, N., Yager, K. G., & Tsai, E. (2023). VISION: A modular AI assistant for natural hu
原创 集智与上智院 集智俱乐部
VISION的系统架构概览 | 来源:Mathur, S., van der Vleuten, N., Yager, K. G., & Tsai, E. (2023). VISION: A modular AI assistant for natural human-instrument interaction at scientific user facilities. arXiv preprint arXiv:2412.18161.推荐理由:VISION[7]开创性地将模块化AI架构引入科学实验,通过将不同的认知模块有机整合,实现了首个全面的自然语言实验控制系统。它为人机协同科研提供了新的交互范式。科学实验设备的操作一直是一个专业性很强的领域,传统上需要研究人员掌握复杂的专业操作界面和命令。这不仅给研究人员带来很大的学习负担,也成为科研自动化的重要障碍。如何让科学家能够用自然语言与科研设备直接“对话”,让设备理解并执行研究人员的意图,这=是一个具有重要意义又充满挑战的课题。VISION的突破性在于它提出了一种创新的模块化AI架构。系统由多个功能模块(Cognitive Blocks)组成,每个模块都基于一个针对特定任务优化的大语言模型。这些模块协同工作,共同完成从语音识别、意图理解到任务规划和代码生成的全流程。具体来说,系统包含转录器(Transcriber)、分类器(Classifier)、操作员(Operator)和分析师(Analyst)等关键模块。这些模块以工作流(Workflow)的形式进行组织和调度。当用户发出一个请求时,系统首先判断其属于数据采集、分析还是其他类型,然后调用相应的工作流处理。最后,系统将生成的代码或分析结果返回给用户确认,并在获得许可后提交给底层的实验控制平台执行。整个过程中,用户通过自然语言与系统交互,无需了解复杂的技术细节。VISION的意义在于它开创了一种全新的人机交互范式。通过模块化的架构设计,它充分利用了大语言模型在不同任务上的特长,实现了全面的语言理解和任务执行能力。同时,它将前沿的AI技术与传统的科研工作流程巧妙结合,极大地提高了实验效率和灵活性。更重要的是,它为实现“用语言做实验”这一科研人员的长期愿景迈出了关键一步。挑战与展望然而,基于LLM的科学研究也面临着几个根本性的挑战:幻觉问题,LLM可能生成表面上合理但实际上不准确的内容,这在科学研究中尤其危险;创新的认知边界问题,LLM的“创新”源自已有知识的重组和推理,这与真正的科学突破性发现可能存在本质差异;可重复性与可解释性的矛盾,科学研究要求结果可重复、过程可追溯,但LLM的黑盒特性与此形成本质冲突。面向未来,大语言模型驱动的科研创新亟需在以下方向实现突破:1.构建可信科研平台:整合跨模态知识,建立链上可追溯、过程可审计、结果可复现的科研基础设施。2.探索人机协同创新范式:发掘研究人员专业经验与LLM知识处理能力的最佳协同路径,实现辅助决策到联合创新的跃升。3.推进跨学科协同治理:计算机、伦理学、科学哲学、科研管理等领域,需协同推进LLM在科研领域的责任评估、伦理审查、规范制定等工作。科学研究正在经历一场方法论的革新。基于LLM的科学研究不仅提供了新的研究工具,更重要的是开创了一种新的认知范式。这种范式将人类的创造力与AI的能力有机结合,有望加速科学发现的进程。随着技术的进步和应用的深入,这种新范式可能会重塑科学研究的方式,开启科学探索的新纪元。参考文献[1] Birhane, A., et al. "Science in the age of large language models." Nature Reviews Physics 5 (2023): 277-280.https://doi.org/10.1038/s42254-023-00581-4推荐理由: 这是一篇重要的评论性文章,由四位AI伦理和政策专家撰写,全面讨论了LLM在科学研究中的潜力和风险。文章不仅提供了清晰的概念框架,还引发了关于LLM在科研中应用的深入讨论。[2] Taylor, R., et al. "Galactica: A Large Language Model for Science." arXiv preprint arXiv:2211.09085 (2022).https://arxiv.org/abs/2211.09085推荐理由: 这是首个专门面向科学文献训练的大规模语言模型的技术报告,详细描述了模型架构、训练策略和评估结果。虽然模型最终下线,但其技术创新和失败教训都具有重要的参考价值。[3] Luo, R., et al. "BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining." Briefings in Bioinformatics 23.6 (2022): bbac409.https://doi.org/10.1093/bib/bbac409推荐理由: 这篇论文介绍了专门针对生物医学领域的预训练语言模型,展示了领域特定LLM的潜力,为其他垂直领域的模型开发提供了重要参考。[4] Bran, A.M., et al. "Augmenting large language models with chemistry tools." Nature Machine Intelligence 6 (2024): 525-535.https://doi.org/10.1038/s42256-024-00832-8推荐理由: 这篇发表在Nature Machine Intelligence的论文展示了如何将LLM与专业工具结合,实现科研流程的自动化。文章提供了详细的系统设计和实验验证,具有很强的实践指导意义。[5] Bolton, E., et al. "BioMedLM: A 2.7B Parameter Language Model Trained on Biomedical Text." arXiv preprint arXiv:2403.18421 (2024).https://arxiv.org/abs/2403.18421推荐理由: 这是一个针对生物医学领域的开源语言模型,论文详细描述了模型训练过程和多任务学习能力,为生物医学领域的AI应用提供了重要工具。[6] Mathur, S., et al. "VISION: A Modular AI Assistant for Natural Human-Instrument Interaction at Scientific User Facilities." arXiv preprint arXiv:2412.18161 (2023).https://arxiv.org/abs/2412.18161推荐理由: 这篇预印本详细描述了一个创新的模块化AI系统,展示了如何通过自然语言实现科研设备控制,为提高实验效率提供了新思路。[7] Singhal, K., et al. "Large Language Models Encode Clinical Knowledge." Nature 620.7972 (2023): 172-180.https://doi.org/10.1038/s41586-023-06291-2推荐理由: 这篇Nature论文展示了LLM在医学领域的应用潜力,特别是在医学知识理解和图像分析方面的突破,为医学AI的发展提供了重要参考。[8] Lin, Z., et al. "GeoGalactica: A Scientific Large Language Model in Geoscience." arXiv preprint arXiv:2401.00434 (2024).https://arxiv.org/abs/2401.00434推荐理由: 这篇论文介绍了如何将Galactica的架构应用到地球科学领域,展示了专业领域大模型的发展潜力,为其他学科的模型开发提供了借鉴。出品:漆远、吴力波、张江运营:孟晋宇、王婷撰稿:张江、杨燕青、王婷、王朝会、十三维、周莉、梁金、袁冰、江千月、刘志毅鸣谢(按姓氏拼音顺序,排名不分先后):曹风雷 、陈小杨 、程远、杜沅岂 、段郁、方榯楷 、付彦伟、 高悦、黄柯鑫、李昊、刘圣超、谭伟敏、吴泰霖、吴艳玲、向红军、张骥、张艳、朱思语原标题:《《AI×SCIENCE十大前沿观察》1:基于LLM的科学研究》 来源:科学鉴感
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!