新壹申请利用大语言模型驱动数字人动作专利,能够让数字人更自然结合会话内容生成视频流

360影视 国产动漫 2025-04-10 16:51 2

摘要:国家知识产权局信息显示,新壹(北京)科技有限公司申请一项名为“一种利用大语言模型驱动数字人动作的方法及系统”的专利,公开号 CN 119785427 A,申请日期为 2024年12月。

金融界2025年4月10日消息,国家知识产权局信息显示,新壹(北京)科技有限公司申请一项名为“一种利用大语言模型驱动数字人动作的方法及系统”的专利,公开号 CN 119785427 A,申请日期为 2024年12月。

专利摘要显示,本发明公开了一种利用大语言模型驱动数字人动作的方法及系统,方法包括调用大模型识别当前及前续会话内容,预测人物的情绪和动作,输出连贯的情绪和动作标签;根据不同情绪与动作的映射关系,结合深度学习与规则库构建方法,建立涵盖多样行为模式的数字人规则库;根据识别出的当前会话的情绪和动作标签,在数字人规则库中调用绑定的表情和动作渲染逻辑,生成实时会话视频流;实时逐帧播放生成的数字人会话视频流。优点为:能够让数字人更自然的结合会话内容,生成带有表情和动作的视频流,并通过循环执行以达到实时播放数字人对话视频流的效果,减少了传统方法中可能出现的表情动作僵硬或与会话内容不匹配情况。

天眼查资料显示,新壹(北京)科技有限公司,成立于2022年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本2549.01961万人民币,实缴资本1164.285715万人民币。通过天眼查大数据分析,新壹(北京)科技有限公司共对外投资了8家企业,参与招投标项目3次,财产线索方面有商标信息35条,专利信息22条,此外企业还拥有行政许可4个。

来源:金融界

相关推荐