平安科技(深圳)有限公司张之勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利基于人工智能的语音识别方法、装置、计算机设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116580702B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310578554.9,技术领域涉及:G10L15/02;该发明授权基于人工智能的语音识别方法、装置、计算机设备及介质是由张之勇;王健宗设计研发完成,并于2023-05-19向国家知识产权局提交的专利申请。
本基于人工智能的语音识别方法、装置、计算机设备及介质在说明书摘要公布了:本发明适用于医疗技术领域,尤其涉及一种基于人工智能的语音识别方法、装置、计算机设备及介质。本发明通过对梅尔频谱矩阵进行随机行遮挡和列遮挡,得到缺失了不同语义信息的第一语音增强矩阵和第二语音增强矩阵;根据编码器提取第一语音帧特征和第二语音帧特征,计算度量子损失对编码器进行自监督训练;得到语音融合特征并输入至解码器中得到映射字符,结合预设字符计算预测损失来对语音识别模型进行有监督训练,根据零字符和非零字符的数量对预测损失和度量损失加权相加,得到目标损失来训练编码器和解码器,将自监督和有监督的训练方式相结合,提高了语音识别模型的识别准确率,极大地提高了医疗技术领域中信息录入的即时性、便利性和准确性。
本发明授权基于人工智能的语音识别方法、装置、计算机设备及介质在权利要求书中公布了:1.一种基于人工智能的语音识别方法,其特征在于,所述语音识别方法包括: 获取待识别语音的N个语音帧信号,以及各个语音帧信号对应的预设字符,获取各个所述语音帧信号的梅尔频谱矩阵,其中,N为正整数; 对各个所述梅尔频谱矩阵的行进行随机遮挡,得到第一语音增强矩阵,对各个所述梅尔频谱矩阵的列进行随机遮挡,得到第二语音增强矩阵; 将各个所述第一语音增强矩阵输入至编码器中进行特征提取,得到第一语音帧特征,将各个所述第二语音增强矩阵输入至编码器中进行特征提取,得到第二语音帧特征,根据N个所述第一语音帧特征、N个所述第二语音帧特征和预设的度量损失函数,计算得到N个度量子损失; 对各个所述第一语音帧特征和对应的所述第二语音帧特征进行特征融合,得到N个语音融合特征,将各个所述语音融合特征输入至解码器中进行特征映射,得到N个所述语音帧信号对应的N个映射字符; 根据N个所述映射字符、N个所述预设字符和预设的预测损失函数,计算得到预测损失,将N个所述度量子损失相加,计算得到度量损失; 对所述预测损失和所述度量损失进行加权相加,确定加权相加结果为目标损失,以所述目标损失为依据,对所述编码器和所述解码器进行训练,得到训练好的编码器和训练好的解码器,作为训练好的语音识别模型进行语音识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励