Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京清飞科技有限公司魏宇飞获国家专利权

北京清飞科技有限公司魏宇飞获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京清飞科技有限公司申请的专利一种机器人语音交互信号的识别与处理方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120673748B

龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510772944.9,技术领域涉及:G10L15/06;该发明授权一种机器人语音交互信号的识别与处理方法及系统是由魏宇飞设计研发完成,并于2025-06-11向国家知识产权局提交的专利申请。

一种机器人语音交互信号的识别与处理方法及系统在说明书摘要公布了:本发明公开一种机器人语音交互信号的识别与处理方法及系统,涉及电数字处理技术领域,所述方法包括:基于高资源语音数据训练一个基础声学模型;冻结基础声学模型的底层参数,并利用低资源语音数据微调顶层语言特异性参数,得到多语种语音信号识别模型;对多语种语音信号识别模型进行加速处理;拆分语音信号的处理任务,并利用机器人的硬件资源对处理任务进行并行化;根据人机交互历史数据自适应优化多语种语音信号识别模型。支持中英文混合输入、方言及低资源语言的精准识别,采用轻量化端到端语音识别模型与并行化处理架构,实现低延迟与高实时性。

本发明授权一种机器人语音交互信号的识别与处理方法及系统在权利要求书中公布了:1.一种机器人语音交互信号的识别与处理方法,其特征在于,包括: Step1、基于高资源语音数据训练一个基础声学模型,具体分为以下子步骤: 将高资源语音数据转化成数值序列作为模型输入,对应的音素序列作为模型输出构建第一训练数据集; 使用第一训练数据集对基础声学模型进行预训练,增强模型对跨语言共性特征的提取能力;先优化对比损失,增强模型对跨语言共性特征的提取能力,将第一训练数据集中的数据样本分批输入到基础声学模型,并根据对比损失计算结果进行模型微调; 引入联合训练策略使模型逐步过渡到音素分类任务;当对比损失曲线不再有明显的下降趋势时引入联合训练策略,使模型逐步过渡到音素分类任务,此时需要根据总损失计算结果来对模型进行进一步训练,总损失的计算公式为:,其中为可调权重,是对比损失,是通过动态规划计算的输入样本到模型输出所有可能的对齐路径概率和,为模型输出音素序列对于实际音素序列所替换掉的音素数量,为模型输出音素序列对于实际音素序列所删除掉的音素数量,为模型输出音素序列对于实际音素新插入的音素数量,为实际音素序列内因素的总数量; Step2、冻结基础声学模型的底层参数,并利用低资源语音数据微调顶层语言特异性参数,得到多语种语音信号识别模型,具体分为以下子步骤: 根据低资源数据量自适应选择冻结层数;使用公式:自适应选择当前模型应当被冻结的层数,其中为基础声学模型的总层数,为低资源语音数据的数据量,为高资源语音数据的数据量; 将低资源语音数据处理为第二训练数据集; 使用转化函数将低资源语音数据转化为数值序列作为模型输入,对应的音素序列作为输出,整理后得到第二训练数据集,所述转化函数表示为:,其中为某高资源语音数据A中的第i帧语音信号,是时变陡峭度参数,是相位增强系数,和分别是A中第i帧、第帧语音信号的基频,是向下取整函数,n是A中语音帧的总数量; 利用第二训练数据集对未冻结的顶层模型参数进行微调; 顶层微调阶段中总损失的计算公式表示为:,其中是当前模型对于输入样本中第t项数据的交叉熵损失,t取值1~T,T为输入样本中包含的数据项总数,为可调权重,是KL散度计算函数,表示基础声学模型对于输入样本的输出概率分布,表示当前模型对于输入样本的输出概率分布,,是当前模型的第j项模型参数,是的Fisher信息矩阵对角值,是基础声学模型的第j项模型参数,j取值1~m,m是模型参数的总数;进行前1000步微调训练时,均设为0,仅基于交叉熵损失提升模型对低资源语音数据的泛化能力,进行后续的微调训练时再根据实际情况为赋值,用以避免模型的过拟合与灾难性遗忘问题; Step3、对多语种语音信号识别模型进行加速处理; Step4、拆分语音信号的处理任务,并利用机器人的硬件资源对处理任务进行并行化,具体为:将语音信号处理任务拆分为三级流水线并行子任务,分别部署到机器人的不同计算芯片并行处理,其中Stage1部署于DSP芯片,执行信号采集、分帧、噪声抑制任务;Stage2部署于CPU+FPGA,执行CPU端的信号转化任务与FPGA端的基频提取任务;Stage3部署于GPU,执行上下文拼接、音素识别、流式解码任务;每个阶段维护两个缓冲区A、B,当Stage1写入缓冲区A时,Stage2处理缓冲区B,Stage3读取前一周期结果,通过双缓冲区优化并行速率; Step5、根据人机交互历史数据自适应优化多语种语音信号识别模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京清飞科技有限公司,其通讯地址为:100123 北京市朝阳区高碑店乡西店村69-106号北门三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。