基准资讯_360影视

谷歌DeepMind新基准QuestBench：考验AI模型“填补信息漏洞”实力

近期，科技界传来一项新进展，谷歌DeepMind团队推出了一项名为QuestBench的全新基准测试，旨在评估大型语言模型（LLMs）在推理任务中识别和填补信息缺口的能力。这一创新举措针对现实世界中信息不完整的问题，为LLMs的发展提供了新的挑战与机遇。

《基准》根据《中华人民共和国行政处罚法》《中华人民共和国反垄断法》《国务院关于经营者集中申报标准的规定》《经营者集中审查规定》等制定，采用条文与案例相结合的方式，共18条，包含案例7个。《基准》坚持问题导向，深入总结违法实施经营者集中行政处罚工作积累的实践经验