摘要:近期,人工智能技术领域迎来两项重要进展。百度于3月16日正式发布文心大模型4.5及X1,两款模型均免费向公众开放,进一步降低AI技术应用门槛;与此同时,智元机器人推出的对抗式数据采集范式(ADC)与启元GO-1大模型结合,为具身智能领域提供新的技术路径。两项突
近期,人工智能技术领域迎来两项重要进展。百度于3月16日正式发布文心大模型4.5及X1,两款模型均免费向公众开放,进一步降低AI技术应用门槛;与此同时,智元机器人推出的对抗式数据采集范式(ADC)与启元GO-1大模型结合,为具身智能领域提供新的技术路径。两项突破分别从多模态能力提升与数据效率优化角度,推动AI技术向产业化纵深发展。
百度文心大模型升级:多模态协同与深度思考能力突破
文心大模型4.5作为百度首个原生多模态基础模型,通过跨模态联合建模实现协同优化,其核心能力覆盖文字、图片、音频、视频的综合理解。该模型在逻辑推理、代码生成及去幻觉能力上均有显著提升,尤其在教育解题、商业分析等场景中展现出高效推演能力。例如,模型可解析包含图表和文本的复合题型,并生成逻辑严密的解题过程。
文心大模型X1则定位为“深度思考模型”,首次实现自主工具调用能力。该模型在中文知识问答、文学创作及复杂计算任务中表现突出,其规划与反思能力使其能够模拟人类决策链条,例如在撰写长文本时自主调整结构并优化表达。目前,X1已接入百度搜索、文小言APP等产品,未来或进一步赋能企业级应用。
商业化层面,文心大模型4.5与X1已上线百度智能云千帆平台,企业可通过API调用以较低成本集成AI能力。据公开信息,文心大模型4.5的API调用价格仅为同类产品的1%,显著降低中小企业的技术应用门槛。
智元机器人对抗式数采范式:提升数据效率与模型鲁棒性
智元机器人在发布通用具身基座模型GO-1后,进一步推出对抗式数据采集(ADC)范式。该方法通过在数据采集阶段引入动态扰动(如视觉遮挡、模糊指令等),增强单条数据的多样性与信息密度。测试显示,采用ADC采集的数据量仅为传统方法的20%,但训练后的模型性能达到传统方法的2.7倍。
在静态环境测试中,ADC训练的模型在复杂任务中表现稳定,三组测试条件下的平均成功率分别提升53%、70%和59%。这一突破为机器人具身智能的落地提供了新思路,例如在工业场景中,模型可应对设备突发故障或环境变化的干扰,减少对海量标注数据的依赖。
技术路径上,ADC通过模拟真实场景的干扰因素,提升模型在动态环境中的泛化能力。相较于依赖数据增广或迁移学习的传统方案,ADC从数据源头优化训练集质量,为降低AI开发成本提供可行方案。
两项技术进展分别从多模态融合与数据效率维度推动AI技术升级,其产业化应用前景值得持续关注。百度通过开放大模型加速技术普惠,而智元机器人则从数据采集环节突破具身智能瓶颈,二者共同指向AI技术与垂直场景深度融合的趋势。
来源:金融界