摘要:在智能时代,机器学习和深度学习等算法在多个领域取得了显著的进展,尤其是在自然语言处理、计算机视觉和语音识别等任务中表现出色。然而,尽管这些算法在处理大规模数据和复杂模式识别上展现了强大的能力,机器算法仍然存在诸多局限性。首先,深度学习模型通常依赖于大量的标注数
导语
在智能时代,机器学习和深度学习等算法在多个领域取得了显著的进展,尤其是在自然语言处理、计算机视觉和语音识别等任务中表现出色。然而,尽管这些算法在处理大规模数据和复杂模式识别上展现了强大的能力,机器算法仍然存在诸多局限性。首先,深度学习模型通常依赖于大量的标注数据,而数据的获取和标注成本高昂,且在一些领域如医学诊断中,数据稀缺问题尤为严重。其次,机器算法在面对复杂、动态的环境时,其决策能力依然有限,尤其在处理需要直觉、创造力和道德判断的任务时,远远不及人类。
与此不同,人类智能具备独特的优势。人类不仅能够理解复杂的背景信息,还能够在不完全的条件下做出高效决策,尤其是在应对新问题时,人类能够利用丰富的经验和常识进行推理。此外,人类能够灵活地适应变化和不确定性,做出伦理和情感驱动的判断,这是当前机器算法无法替代的。
因此,单纯依赖机器的智能已无法满足日益复杂的任务需求。人机协同应运而生,成为弥补机器算法局限性和发挥人类独特智能的必要方式。通过人类和机器的紧密合作,我们可以在充分利用机器运算速度与处理能力的同时,借助人类的智慧和创造力,实现更高效、更智能的决策与创新。
本系列读书会旨在深入探讨人机协作的基本原理与核心技术。我们将重点关注以下关键问题:
1. 人类智能与机器智能的自主性:人类智能和机器智能各自的优势有哪些?智能边界如何?
2. 数据稀缺性与标注成本:如何通过更有效的标注策略和数据生成技术来解决数据稀缺问题?
3. 人类与机器的有效协作:如何设计更加高效的人机协作系统,使得人类的知识能够最大限度地提升机器学习的效果?如何针对不同的任务场景(如自然语言处理、计算机视觉)和不同的模型(如大语言模型)实现高效可靠的人机协作?
4. 系统的自适应与独立性:如何设计能够独立运作且在实际应用中高效协作的系统?
5. 实际应用中的人机协同:在人机协同中,如何提高机器决策的可解释性与透明性,确保系统的可信度?如何通过多模态协作将视觉、语言等不同感知通道融合,以应对复杂的决策任务?
赵云波,中国科学技术大学教授、博士生导师,合肥综合性国家科学中心人工智能研究院双聘研究员,入选国家海外引才计划青年项目。研究以“AI驱动”为特色,包括AI驱动的网络化智能控制、AI驱动的博弈决策和AI驱动的人机混合智能等方面。发表学术论文100余篇,出版Springer英文专著2部、科学出版社中文专著1部。任多个专业委员会委员和网络化控制学组秘书长等社会职务。
研究方向:AI 驱动的网络化智能控制、AI 驱动的人机系统自主性、AI 驱动的非完全信息博弈决策。
吴兴蛟,华东师范大学药学院副教授。曾获上海市超级博士后。在重要国际会议/期刊发表学术论文40余篇,其中SCI一区/CCF A类11篇(其中一作/通讯9篇),SCI二区/CCF B类15篇(其中一作/通讯7篇)。主持国家自然科学基金青年科学基金、上海市2024年度“科技创新行动计划”新一代信息技术关键技术攻关(第一批)项目、上海市多维度信息处理重点实验室开放课题项目、华东师范大学优秀博士生学术创新能力提升计划项目,作为子项目负责人主持华为诺亚方舟实验室合作项目等。研究工作获上海市技术发明一等奖一项、上海市科技进步二等奖一项,博士期间获中国大学生自强之星、上海市优秀毕业生等荣誉称号。
研究方向:AI4Science、数字药物,人在回路计算。
第二步:填写信息后,付费299元(可开发票)。
如需用支付宝支付,请在PC端进入读书会页面报名支付:
第三步:添加负责人微信,拉入对应主题的读书会社区(微信群)。
本读书会可开发票,请联系相关负责人沟通详情。
PS:为确保专业性和讨论的聚焦,本读书会谢绝脱离读书会主题和复杂科学问题本身的空泛的哲学和思辨式讨论; 如果出现讨论内容不符合要求、经提醒无效者,会被移除群聊并对未参与部分退费。
加入社区后可以获得的资源:
完整权限,包括 线上问答、录播回看、资料共享、社群交流、信息同步、共创任务获取积分等 。
参与共创任务获取积分,共建学术社区:
读书会采用共学共研机制,成员通过内容共创获积分( 字幕修改、读书会笔记、论文速递、公众号文章、集智百科、论文解读等共创任务 ),积分符合条件即可退费。发起人和主讲人同样遵循此机制,无额外金钱激励。
PS:具体参与方式可以加入读书会后查看对应的共创任务列表,领取任务,与运营负责人沟通详情,上述规则的最终解释权归集智俱乐部所有。
自主性理论与方法
1. 本书首先讨论了人工智能时代人机系统的新发展,然后分别介绍人机混合智能系统的自主性基本理论和设计方法,涵盖了人机混合智能系统的 自主性定义、边界判定、各种介入控制和共享控制方法 等重要内容。
赵云波, 康宇. (2021). 人机混合智能系统自主性理论和方法. 科学出版社.
2. 随着人工智能在军事行动中的应用逐渐深入,人类与自主系统之间的信任关系将变得更加复杂。适当的信任校准对于确保有效的合作至关重要,特别是在 数据分析、自主系统和决策支持 等领域。在未来的军事行动中,如何平衡信任与控制、独立性与合作,将成为决定技术应用成功与否的关键。
Michael Mayer (2023) Trusting machine intelligence: artificial intelligence and human-autonomy teaming in military operations, Defense Security Analysis, 39:4, 521-538, DOI: 10.1080/14751798.2023.2264070
3. 本文对未来航空军事领域的发展趋势——人机混合智能技术进行了阐述。人机混合智能技术是当前人工智能领域的重要研究方向, 针对航空军事领域的典型问题 ,本文提出了运用人机混合智能技术解决 未来空战中感知、判断、决策和执行问题的基本解决方案 ,最后对人机混合智能的未来发展进行了展望。
Deng Pingyu,Qiu Xuyi,Yao Ziyu.Human-machine hybrid intelligence technology in military aviation field[J].Aeronautical Science Technology,2020,31(10):3-6.邓平煜,裘旭益,姚子羽.航空军事领域的人机混合智能技术[J].航空科学技术,2020,31(10):3-6.
数据与模型中的人机协同
1. 综述:Human in the Loop (人在环,HITL)的目标是 整合人类的知识和经验 ,以 最小的成本 训练出准确的预测模型。本文从数据的角度对现有的关于Human in the Loop(人在环,HITL)的工作进行了考察,并将其分为三个具有递进关系的类别:(1)通过 数据处理 提高模型性能的工作;(2)通过 介入模型训练 提高模型性能的工作;(3) 独立HITL系统设计 ,总结综述了该领域的主要方法。
Wu X, Xiao L, Sun Y, et al. A survey of human-in-the-loop for machine learning[J]. Future Generation Computer Systems, 2022, 135: 364-381.
2. 数据整合的目的是将不同来源的数据整合起来,然而,数据整合不能完全依赖于自动化方法来解决。本文提出了一种混合的 人机数据整合框架 ,首先使用 基于规则的算法 来 识别可能的匹配对 ,然后基于选择-推理-验证框架,通过 人类群体进一步验证这些候选匹配对 ,从而确定实际的匹配对,快速且准确地完成数据匹配和验证工作。
Li G. Human-in-the-loop data integration[J]. Proceedings of the VLDB Endowment, 2017, 10(12): 2006-2017.
3. 介绍了 人机协作技术在机器学习中的应用 ,具体探讨了人类在数据预处理、数据标注、模型训练和推理等机器学习流程中的重要角色。人类不仅能为机器学习应用提供训练数据,还能通过机器辅助的方式直接完成一些机器难以完成的任务,如数据整合、数据清洗、数据标注、模型训练和推理等。
Chai C, Li G. Human-in-the-loop Techniques in Machine Learning[J]. IEEE Data Eng. Bull., 2020, 43(3): 37-52.
4. 过去的研究主要集中于LLM本身,而很少探索 人类在LLM推理过程中的干预作用 。本研究提出的方法通过人机协作优化了 机器翻译过程 ,特别是在特定领域翻译中表现出较强的优势。通过人类反馈和自动检索系统的结合,LLM能够更加精准地生成翻译结果,提升了翻译质量。
Yang X, Zhan R, Wong D F, et al. Human-in-the-loop machine translation with large language model[J]. arXiv preprint arXiv:2310.08908, 2023.
5. 本文提出了一种 人机协作的小样本学习方法 ,旨在应对小样本学习中出现的分布外(OOD)样本问题。由于有限的训练样本难以充分反映新类别样本的有效性,测试阶段可能会出现 与已有数据差异较大的异质样本 。为解决这一问题,本文在小样本学习系统中引入了 不确定性评估模块 ,实时检测OOD样本并将其交给 人类进行主动标注 。
Wan S, Hou Y, Bao F, et al. Human-in-the-loop low-shot learning[J]. IEEE transactions on neural networks and learning systems, 2020, 32(7): 3287-3292.
6. 本文提出的人机协作的对话学习方法,使用强化学习框架让对话智能体通过与人类互动获取反馈,进而提升问答能力。模拟环境和实际实验验证了该方法的可行性,并为未来智能对话系统的自我学习和优化提供了新思路。
Li J, Miller A H, Chopra S, et al. Dialogue learning with human-in-the-loop[J]. arXiv preprint arXiv:1611.09823, 2016.
7. 这篇论文回顾了人在环学习领域的前沿技术,深入探讨了新型的 人工智能与人类交互关系的具体方式 ,包括主动学习、交互式机器学习、机器教学、课程学习、 可解释人工智能 等。文章不仅仅列举了不同的 研究方法 ,还定义和澄清了一些混乱、不同甚至有时相互矛盾的 术语 ;明确了不同方法之间的界限;并通过关联这些技术,探索它们之间的联系和相互影响。
Mosqueira-Rey E, Hernández-Pereira E, Alonso-Ríos D, et al. Human-in-the-loop machine learning: a state of the art[J]. Artificial Intelligence Review, 2023, 56(4): 3005-3054.
8. 强化学习(RL)已成为机器人技术中一种流行的学习方法,但在面对复杂任务时,设计足够信息量的奖励函数仍然是一大挑战。传统的基于奖励的强化学习方法,通常要求人工设计明确的奖励函数,这样可能会导致系统无法完全理解或表达任务中的人类偏好和期望。 偏好学习 (Preference-based RL)算法直接 通过人类反馈来学习奖励函数 。然而,现有的偏好学习方法也存在一些问题:一方面,它们通常需要过多的查询量成本很高;另一方面,有些方法过于限制了奖励函数的种类,导致无法在复杂的机器人任务中实现足够的表达力。这篇研究将偏好学习问题从 传统的查询最小化 转变为 多任务学习的扩展 ,使得机器人能够在更少的数据量和反馈下,完成更复杂的操作任务。
Hejna III D J, Sadigh D. Few-shot preference learning for human-in-the-loop rl[C]//Conference on Robot Learning. PMLR, 2023: 2014-2025.
交叉领域的人机协同
1. 本综述探讨了深度学习在 医学图像分析 中的应用,特别是强调了人类的参与在确保模型安全性和准确性方面的重要性。文章重点评估了四个关键领域:1) 主动学习 ,通过选择最有价值的标注数据来提高模型性能;2) 与模型输出的交互 ,通过 迭代反馈优化模型预测和提供可解释性 ;3) 实际应用 考虑,包括数据隐私、系统兼容性和稳定性等问题;4) 未来展望,探讨了未来的研究方向和人机协作中的知识空白。
Budd S, Robinson E C, Kainz B. A survey on active learning and human-in-the-loop deep learning for medical image analysis[J]. Medical image analysis, 2021, 71: 102062.
2. 本文介绍了一种名为 CPR Tutor 的 实时多模态反馈系统 ,旨在为心肺复苏(CPR)培训提供帮助。CPR Tutor 使用 递归神经网络(RNN) 来检测训练中的错误,并根据五个CPR表现指标自动识别和评估胸部按压的质量。该系统通过分析 包含运动学数据和肌电图数据的多模态数据流 ,实时检测训练中的错误。根据这些评估结果,CPR Tutor 会提供语音反馈,以纠正最关键的错误,并改进CPR表现。
Di Mitri D, Schneider J, Drachsler H. Keep me in the loop: Real-time feedback with multimodal data[J]. International Journal of Artificial Intelligence in Education, 2022, 32(4): 1093-1118.
3. 演化艺术(Evolutionary Art)是演化计算(Evolutionary Computing)中的一个子领域,旨在通过演化技术创造出具有艺术性和美学价值的图像。早期的工作并没有探索替代的适应度评估方法,也未考虑颜色因素对适应度的影响,也没有对结果进行独立的验证。这项研究提出了四种适应度函数,这些函数的设计理念基于图像复杂性与处理复杂性之间的比率。为了验证这些适应度函数的有效性,作者开展了一项由100名参与者组成的调查,结果表明,使用这些适应度函数能够生成美学上令人愉悦的图像。这一发现证明了通过演化算法,完全不依赖人工干预,也能生成具有美学吸引力的图像。
Atkins D L, Klapaukh R, Browne W N, et al. Evolution of aesthetically pleasing images without human-in-the-loop[C]//IEEE Congress on Evolutionary Computation. IEEE, 2010: 1-8.
4. 这篇论文回顾了人在环学习领域的前沿技术,深入探讨了新型的 人工智能与人类交互关系的具体方式 ,包括主动学习、交互式机器学习、机器教学、课程学习、 可解释人工智能 等。文章不仅仅列举了不同的 研究方法 ,还定义和澄清了一些混乱、不同甚至有时相互矛盾的 术语 ;明确了不同方法之间的界限;并通过关联这些技术,探索它们之间的联系和相互影响。
5. 这篇文章提出了一种在数字孪生(DT)和动态数据驱动应用系统(DDDAS)中引入 可解释性 的方法,旨在提升决策可信度。通过结合 可解释机器学习和目标建模 ,利用 双向共生感知反馈循环 进行决策解释,并通过效用权衡分析评估决策效果。该方法保持了人类在回路中的参与,确保决策符合实际需求。以智能仓储为例,展示了如何提高决策质量和系统准确性,避免错误更新,提升整体效用。
Zhang N, Bahsoon R, Tziritas N, et al. Explainable human-in-the-loop dynamic data-driven digital twins[C]//International Conference on Dynamic Data Driven Applications Systems. Cham: Springer Nature Switzerland, 2022: 233-243.
6. 这篇文章探讨了人工智能(AI)在 工作场所 整合的趋势与挑战,强调设计 公正、可靠、透明的AI系统 ,旨在 增强人类能力而非替代 。通过应用人机交互(HITL)和可解释人工智能(XAI)方法,可以创建新的互动模式和动态,推动工作实践的转型。这些方法帮助建立透明可理解的AI系统,使人类用户能够信任并与AI协作,提升工作效率,开辟未来工作的创新设计空间。
Tsiakas K, Murray-Rust D. Using human-in-the-loop and explainable AI to envisage new future work practices[C]//Proceedings of the 15th International Conference on PErvasive Technologies Related to Assistive Environments. 2022: 588-594.
集智俱乐部读书会 是面向广大科研工作者的系列论文研读活动,其目的是共同深入学习探讨某个科学议题,了解前沿进展,激发科研灵感,促进科研合作,降低科研门槛。
读书会活动始于 2008 年,至今已经有 50 余个主题,内容涵盖复杂系统、人工智能、脑与意识、生命科学、因果科学、高阶网络等。凝聚了众多优秀科研工作者,促进了科研合作发表论文,孵化了许多科研产品。如:2013 年的“深度学习”读书会孕育了彩云天气 APP,2015 年的“集体注意力流”读书会产生了众包书籍《走近2050》,2020年的开始因果科学读书会孕育了全国最大的因果科学社区等。
来源:晚晚的星河日记一点号