摘要:5月20日,中国信通院发布大模型推理能力评估结果,来自北京的大模型百度文心X1 Turbo在24项能力评估中16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”。百度集团副总裁吴甜透露,目前文心大模型已拥有了自我迭代的“最强大脑”,不仅解决了大
5月20日,中国信通院发布大模型推理能力评估结果,来自北京的大模型百度文心X1 Turbo在24项能力评估中16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”。百度集团副总裁吴甜透露,目前文心大模型已拥有了自我迭代的“最强大脑”,不仅解决了大模型训练过程中数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。
中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,2024年人工智能能力持续进化,在多任务语言理解、竞赛级数学、博士级科学问题等之前具有挑战性的基准测试中超越了人类的表现。
吴甜介绍,大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术,百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。
此外,在代码生产的场景中,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。吴甜透露,百度目前每天新增的代码中,文心快码生成的代码占比已超过40%,且文心快码已经向全社会开放,累计服务760万开发者。
记者:孙奇茹
来源:子清视界