摘要:大语言模型遭遇囚徒困境时,会如何决策?目前人工智能在面对复杂决策,特别是涉及到与其他智能体的互动时,依然存在很大的局限性。即使是最先进的大型语言模型(LLM)在处理这些博弈时也面临着计算纳什均衡的挑战,在面对不确定性和噪声时仍存在鲁棒性问题。
导语
大语言模型遭遇囚徒困境时,会如何决策?目前人工智能在面对复杂决策,特别是涉及到与其他智能体的互动时,依然存在很大的局限性。即使是最先进的大型语言模型(LLM)在处理这些博弈时也面临着计算纳什均衡的挑战,在面对不确定性和噪声时仍存在鲁棒性问题。
如何创建一个理性的基于LLM的智能体?能否通过创新的算法工作流来提高智能体的谈判能力和资源分配效率?针对这些问题,分享嘉宾提出了基于博弈论的工作流:将博弈论作为基础,以理性和帕累托最优性作为两大基本评估指标——即个体是否理性,以及是否基于个体理性得出全局最优解——旨在观察并提升智能体在以自我利益最大化为指导的交互中的表现。
本周日上午10点,带来社区福利:来自罗格斯大学的华文越将分享她的最新研究成果,谈谈博弈论在智能体中的应用。欢迎加入一起探索如何设计工作流,来指导智能体面对不同的场景。
分享内容简介
完全信息博弈
LLM在经典博弈中的局限
基于经典博弈的工作流设计
不完全信息博弈
LLM与资源分配博弈实验
基于资源分配博弈的工作流设计
意外发现
单个智能体使用工作流的局限与影响
未来方向
设计元策略选择工作流
主讲人介绍
华文越,罗格斯大学新布朗斯维克分校在读博士,导师为张永锋老师,研究方向为LLM,LLM-based Agent等。
发表论文在ICLR, NeurIPS, ACL, EMNLP, TACL, EACL等期刊。ARR/EMNLP/SIGIR/WWW/WSDM/RecSys/TORS审核中。
个人主页:https://wenyueh.github.io/。
主持人介绍
赵世钰
任沁源
崔金强
主要涉及到的参考文献
[1] Hua W, Liu O, Li L, et al. Game-theoretic LLM: Agent Workflow for Negotiation Games[J].
本次分享将于2024年 12 月 22 日(本周日)上午10:00-11:00在腾讯会议进行,感兴趣的朋友可以扫码参与本次分享,并加入读书会社群。
扫码参与,加入群聊,获取系列读书会回看权限,成为种子用户,与社区的一线科研工作者与企业实践者沟通交流,共同推动多智能体这一前沿领域的发展。
报名成为主讲人
读书会成员均可以在读书会期间申请成为主讲人。主讲人作为读书会成员,均遵循内容共创共享机制,可以获得报名费退款,并共享本读书会产生的所有内容资源。具体见系列读书会详情:
大模型与多智能系统体社区招募中
集智俱乐部携手西湖大学工学院特聘研究员赵世钰、浙江大学教授任沁源、鹏城实验室高级工程师崔金强,共同发起了。
在本次读书会中,我们将讨论大模型与智能体的相关话题,内容涵盖大语言模型赋能下智能体之间的辩论、协作、模拟人类,以及实际场景中的多机器人协作等问题。我们已邀请到多名科研前沿学者进行分享,包括圣母大学的郭泰成博士、中科院自动化的马纬彧硕士、清华大学的钱忱博士后研究员、伊利诺伊大学厄巴纳香槟分校的王镇海龙博士、清华大学的徐玉庄硕士、清华大学的杨宗瀚博士、清华大学的刘子君、马萨诸塞大学阿默斯特分校的张洪鑫博士、浙江大学的张锦添硕士、NVIDIA NeMo NLP团队的高级应用科学家王智琳、北京大学的董益宏博士 、麻省理工学院的郑志凌博士后、清华大学的梁添硕士、麻省理工大学的Yilun Du博士、新泽西州立罗格斯大学新布朗斯维克的华文越博士、弗吉尼亚理工大学的Navid Ghaffarzade教授,如果您对大模型与多智能体系统感兴趣,欢迎加入我们,可以来做分享,也可以来交朋友,最重要的是一起来学习!
特别致谢单位
此次活动特别鸣谢Datawhale、Agents42。
Datawhale
一个专注于AI领域的开源组织,汇聚了众多优秀学习者,使命for the learner,和学习者一起成长。
一个致力于推进AI Agents产学研融合及创新的生态开放平台。
来源:鸿涛教育