healthbench

安全是最大奢侈：HealthBench是刷榜工具还是医疗AI能力驱动器？

在医疗领域，AI的安全性至关重要。从Character AI导致的悲剧到医疗AI的幻觉问题，安全一直是核心议题。本文将探讨OpenAI推出的HealthBench评估标准，分析其在医疗AI性能和安全性评估中的作用，以及如何通过数据筛选、模型架构和评测体系提升医