中时讯申请基于强化学习策略的智能体优化方法及系统专利,能有效提高学习的稳定性

360影视 2025-01-18 13:31 2

摘要:国家知识产权局信息显示,中时讯通信建设有限公司申请一项名为“一种基于强化学习策略的智能体优化方法及系统”的专利,公开号CN 119312870 A,申请日期为2024年10月。

金融界2025年1月18日消息,国家知识产权局信息显示,中时讯通信建设有限公司申请一项名为“一种基于强化学习策略的智能体优化方法及系统”的专利,公开号CN 119312870 A,申请日期为2024年10月。

专利摘要显示,本发明公开了一种基于强化学习策略的智能体优化方法及系统,通过近端策略限制策略更新的步长,能有效提高学习的稳定性,减少因策略更新过大而导致的训练不稳定或性能下降问题,深度神经网络结合强化学习算法能够提高智能体的泛化能力和应对复杂环境的能力,通过采用MADDPG算法考虑其他智能体的行为来优化自身的策略,这种协同机制使得智能体在共享环境中能够实现全局最优或更优的协同效果,通过模拟环境能够减少了对真实世界交互的依赖,同时,半监督学习方法利用少量标注数据和大量未标注的模拟数据,使得智能体能够在学习过程中不断地自我改进和优化,不仅提高了智能体的环境适应性,还降低了对大量标注数据的依赖,降低了数据收集和处理的成本。

天眼查资料显示,中时讯通信建设有限公司,成立于2012年,位于广州市,是一家以从事计算机、通信和其他电子设备制造业为主的企业。企业注册资本20000万人民币,实缴资本20000万人民币。通过天眼查大数据分析,中时讯通信建设有限公司参与招投标项目5000次,专利信息84条,此外企业还拥有行政许可59个。

来源:金融界

相关推荐