北京风平智能科技有限公司王鹤获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京风平智能科技有限公司申请的专利基于同一真人单次训练的多素材口型同步方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121582984B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610102064.5,技术领域涉及:G06V40/16;该发明授权基于同一真人单次训练的多素材口型同步方法及装置是由王鹤设计研发完成,并于2026-01-26向国家知识产权局提交的专利申请。
本基于同一真人单次训练的多素材口型同步方法及装置在说明书摘要公布了:本申请提供了一种基于同一真人单次训练的多素材口型同步方法及装置,该方法包括:骤S1、构建包含面部特征、语音特征及人脸姿态特征的样本数据;步骤S2、训练姿态参数预测子网络,以使姿态参数预测子网络输出的人脸姿态特征趋向于样本数据中的预期人脸姿态特征;步骤S3、对面部特征进行坐标变换,以将面部特征的参数映射至正面视角下的标准坐标体系内;步骤S4、通过时序建模学习融合特征与口型动作的动态映射关系,获得能够预测下一帧面部特征的LSTM网络;步骤S5、基于训练完成的LSTM网络输出数字人下一帧的面部特征。本申请简化了数据采集流程,提高了口型同步效率,降低了成本,提升了同步效果稳定性。
本发明授权基于同一真人单次训练的多素材口型同步方法及装置在权利要求书中公布了:1.一种基于同一真人单次训练的多素材口型同步方法,其特征在于,包括: 步骤S1、采集同一真人在不同人脸角度下的面部特征及与该面部特征对应的语音特征,构建包含面部特征、语音特征及人脸姿态特征的样本数据,所述人脸姿态特征用于表征人脸角度; 步骤S2、将所述样本数据输入到姿态参数预测子网络中,训练所述姿态参数预测子网络,以使所述姿态参数预测子网络输出的人脸姿态特征趋向于样本数据中的预期人脸姿态特征; 步骤S3、根据所述姿态参数预测子网络输出的人脸姿态特征对所述面部特征进行坐标变换,以将面部特征的参数映射至正面视角下的标准坐标体系内; 步骤S4、将映射后的面部特征与语音特征通过注意力机制进行融合,并输入到LSTM网络中,通过时序建模学习融合特征与口型动作的动态映射关系,获得能够预测下一帧面部特征的LSTM网络; 步骤S5、获取与所述真人一致的数字人的原始视频帧的面部特征及所述数字人拟通过适配口型变化进行语音播报的下一帧语音特征,基于训练完成的LSTM网络输出数字人下一帧的面部特征; 步骤S4中,将映射后的面部特征与语音特征通过注意力机制进行融合,包括先通过全连接层将脸部特征点语音特征分别映射至128维特征空间,再计算两者的注意力权重矩阵,通过矩阵乘法实现特征加权融合;通过时序建模学习融合特征与口型动作的动态映射关系时,由3层双向LSTM网络的主干构成映射层,每层隐藏单元数为256,采用dropout技术防止模型过拟合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京风平智能科技有限公司,其通讯地址为:北京市通州区水仙西路99号2层01-1566;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励