摘要:据prnewswire网3月10日报道,以色列AI21在HumanX 2025大会上发布了Maestro,这是首个为企业设计的人工智能规划和编排系统,旨在大规模提供可靠的人工智能。该系统提高了大型语言模型(LLM)的指令遵循准确率至50%,并提升了质量、可靠性
据prnewswire网3月10日报道,以色列AI21在HumanX 2025大会上发布了Maestro,这是首个为企业设计的人工智能规划和编排系统,旨在大规模提供可靠的人工智能。该系统提高了大型语言模型(LLM)的指令遵循准确率至50%,并提升了质量、可靠性和可观察性,超越了传统LLM和大型推理模型(LRM)的局限。
Maestro显著提升了LLM在复杂任务上的性能,将GPT-4o和Claude Sonnet 3.5等模型的准确率提高了50%,并使o3-mini等推理模型的准确率超过95%,缩小了非推理模型和推理模型之间的性能差距。
尽管企业希望将AI融入运营,但大规模生成式AI部署常面临挑战。根据AWS CDO 2024年议程,仅6%的组织成功部署了生成式AI应用,表明现有AI解决方案在关键任务上存在局限性。传统方法如硬编码链存在控制和可靠性问题。推理模型虽然旨在解决复杂任务,但表现不一致,难以遵循指令。
AI21联合首席执行官Ori Goshen表示,Maestro是迈向大规模可靠人工智能的第一步,提供复杂决策和内置质量控制,使企业能自信地利用AI。
(编译:胡伟)
来源:邮电设计技术