图观(天津)数字科技有限公司刘畅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉图观(天津)数字科技有限公司申请的专利一种数字人生成与交互方法、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121547664B 。
龙图腾网通过国家知识产权局官网在2026-04-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610070667.1,技术领域涉及:H04N21/854;该发明授权一种数字人生成与交互方法、设备及介质是由刘畅;李元;李春漪;丁蕊;陈俊杰;张树庭;李雯设计研发完成,并于2026-01-20向国家知识产权局提交的专利申请。
本一种数字人生成与交互方法、设备及介质在说明书摘要公布了:本申请提供一种数字人生成与交互方法、设备及介质,涉及数字人技术领域,该方法包括构建通用数字人形象及与其匹配的参考动作视频库;基于用户提供的目标数字人形象图像和参考动作视频段,生成与目标数字人形象对应的个性化动作视频库;响应于用户发出的语音唤醒信息,生成对应的回复文本和回复语音;基于回复语音和个性化动作视频库,生成多个回复动作视频段;将回复语音、回复动作视频段以及回复文本时序对齐,再绑定回复文本作为字幕,得到语音、动作、字幕实时同步的同步数字人交互视频;借助通用动作资源解决了传统个性化数字人定制化难度大、成本高的问题,并且,在数字人交互阶段,显著增强数字人交互的真实感、流畅度和实时响应能力。
本发明授权一种数字人生成与交互方法、设备及介质在权利要求书中公布了:1.一种数字人生成与交互方法,其特征在于,包括以下步骤: 构建通用数字人形象及与其匹配的参考动作视频库;所述参考动作视频库至少包括多个参考动作视频段,所述参考动作视频段为所述通用数字人形象展示的多个动作的视频段; 基于用户提供的目标数字人形象的图像和所述参考动作视频段,生成与所述目标数字人形象对应的个性化动作视频库;所述个性化动作视频库至少包括多个目标动作视频段,所述目标动作视频段为所述目标数字人形象展示所述多个动作的视频段; 响应于用户发出的语音唤醒信息,生成对应的回复文本和所述回复文本对应的回复语音; 基于所述回复语音和所述个性化动作视频库,生成多个回复动作视频段; 将所述回复语音、所述回复动作视频段以及所述回复文本进行时序对齐,再绑定所述回复文本作为字幕,得到语音、动作、字幕实时同步的同步数字人交互视频; 构建通用数字人形象及与其匹配的参考动作视频库,具体包括以下步骤: 获取数字人模板提示词,并将所述数字人模板提示词输入至文生图模型,得到数字人模板图像; 获取动作行为描述提示词,并将所述数字人模板图像和所述动作行为描述提示词输入至视频生成模型,得到通用数字人形象及与其匹配的参考动作视频库; 基于用户提供的目标数字人形象的图像和所述参考动作视频段,生成与所述目标数字人形象对应的个性化动作视频库,具体包括以下步骤: 将所述目标数字人形象的图像输入至图生图大模型进行处理,生成目标数字人的正面全身图像;所述目标数字人的正面全身图像包括目标数字人的完整正面身型; 基于动作迁移技术,将所述参考动作视频库中所述通用数字人形象展示的动作迁移至所述目标数字人形象上,生成多个目标动作视频段,获得与所述目标数字人形象对应的个性化动作视频库; 基于动作迁移技术,将所述参考动作视频库中所述通用数字人形象展示的动作迁移至所述目标数字人形象上,生成多个目标动作视频段,具体包括以下步骤: 将所述参考动作视频库中所述通用数字人形象展示的动作替换为所述目标数字人形象,生成初始个性化动作视频段; 基于所述目标数字人形象的图像,对所述初始个性化动作视频段进行面部替换与帧处理,得到修复后个性化动作视频段; 对所述修复后个性化动作视频段进行帧插值处理,生成首尾帧一致的帧间衔接个性化动作视频段; 对所有所述帧间衔接个性化动作视频段进行超分辨率重建,得到目标动作视频段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人图观(天津)数字科技有限公司,其通讯地址为:300000 天津市滨海新区中新天津生态城动漫中路482号创智大厦;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励