中国科学院声学研究所李安冬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院声学研究所申请的专利基于值零分解的多场景声码器的训练方法、音频生成方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120998225B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510768261.6,技术领域涉及:G10L25/30;该发明授权基于值零分解的多场景声码器的训练方法、音频生成方法及装置是由李安冬;郑成诗;代凌玲;郝逢源;李晓东设计研发完成,并于2025-06-10向国家知识产权局提交的专利申请。
本基于值零分解的多场景声码器的训练方法、音频生成方法及装置在说明书摘要公布了:本申请提供了一种基于值零分解的多场景声码器的训练方法及装置,包括:获取多个音频样本;确定每个音频样本的梅尔谱样本;将梅尔谱样本和梅尔谱样本对应的梅尔滤波器,输入到声码器模型中,对声码器模型进行训练,得到每个梅尔谱样本对应的音频预测结果,其中,声码器模型包括值空间模型和零空间模型,声码器模型通过值空间模型根据梅尔谱样本和梅尔谱样本对应的梅尔滤波器,生成第一特征,声码器模型通过零空间模型对第一特征进行线性幅度域的重构及相位信息恢复,得到音频预测结果;确定音频预测结果和音频样本之间的损失值;根据损失值,调整声码器模型的参数,得到训练后的声码器模型。如此,声码器模型能够适配多种不同的场景,从而无需训练不同场景下的声码器,节省计算资源。
本发明授权基于值零分解的多场景声码器的训练方法、音频生成方法及装置在权利要求书中公布了:1.一种基于值零分解的多场景声码器的训练方法,其特征在于,所述方法包括: 获取多个音频样本; 确定所述每个音频样本的梅尔谱样本,不同音频样本的梅尔谱样本是通过具有不同参数配置的梅尔滤波器生成,所述不同参数配置的梅尔滤波器适配不同的场景; 将所述梅尔谱样本和所述梅尔谱样本对应的梅尔滤波器,输入到声码器模型中,对所述声码器模型进行训练,得到所述每个梅尔谱样本对应的音频预测结果,其中,所述声码器模型包括值空间模型和零空间模型,所述声码器模型通过所述值空间模型根据所述梅尔谱样本和所述梅尔谱样本对应的梅尔滤波器,生成第一特征,所述声码器模型通过所述零空间模型对所述第一特征进行线性幅度域的重构及相位信息恢复,得到所述音频预测结果; 确定所述音频预测结果和所述音频样本之间的损失值; 根据所述损失值,调整所述声码器模型的参数,得到训练后的声码器模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院声学研究所,其通讯地址为:100190 北京市海淀区北四环西路21号中国科学院声学研究所;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励