深圳市深航华创汽车科技有限公司黄官富获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市深航华创汽车科技有限公司申请的专利一种智能座舱多模态语音交互系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121034318B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511576814.4,技术领域涉及:G10L17/10;该发明授权一种智能座舱多模态语音交互系统和方法是由黄官富;何天有;宋太荣设计研发完成,并于2025-10-31向国家知识产权局提交的专利申请。
本一种智能座舱多模态语音交互系统和方法在说明书摘要公布了:本发明属于语音处理技术领域,本发明公开了一种智能座舱多模态语音交互系统和方法,包括语音触发单元,采集座舱内的环境音频与视频信息,结合车辆内部的环境感知参数,对是否进入语音交互模式进行判断,当语音交互触发条件成立时,生成与当前环境适配的语音交互输入信号;口型解析单元,对语音交互输入信号进行声学特征提取,同步解析视频信息中驾驶员的唇部运动轨迹,建立语音音素与口型运动的对应关系,形成联合解析特征;候选生成单元,对联合解析特征进行分段对齐,构建连续的多模态片段序列;通过对多模态片段序列进行时间同步,并投影至预定义的意图空间,进而获取包含不同候选意图的候选意图集合;提升了智能座舱的人机交互体验。
本发明授权一种智能座舱多模态语音交互系统和方法在权利要求书中公布了:1.一种智能座舱多模态语音交互系统,其特征在于,包括: 语音触发单元,采集座舱内的环境音频与视频信息,结合车辆内部的环境感知参数,对是否进入语音交互模式进行判断,当语音交互触发条件成立时,生成与当前环境适配的语音交互输入信号; 口型解析单元,对语音交互输入信号进行声学特征提取,同步解析视频信息中驾驶员的唇部运动轨迹,建立语音音素与口型运动的对应关系,形成联合解析特征; 候选生成单元,对联合解析特征进行分段对齐,构建连续的多模态片段序列;通过对多模态片段序列进行时间同步,并投影至预定义的意图空间,进而获取包含不同候选意图的候选意图集合; 所述候选意图集合的获取方法包括: 在全局时间尺度上对多模态片段序列进行时间对齐,预定义意图空间为一组语义类别集合,每个意图对应一个多模态特征分布区域,将时间对齐后的多模态片段序列投影至预定义的意图空间内,进而获取每个多模态片段对应的候选意图和初始置信度;收集所有投影结果,进而生成包含不同候选意图的候选意图集合; 意图仲裁单元,基于候选意图集合,执行预定义的动态规则仲裁逻辑,逐层筛选候选意图并确定最终执行指令; 所述确定最终执行指令的方法包括: 对于候选意图集合,计算每个候选意图的综合置信度;综合置信度为:;其中,表示候选意图的综合置信度;表示候选意图对应的语音模态置信度;表示候选意图对应的视频模态置信度;表示语音模态置信度的动态权重;表示视频模态置信度的动态权重;表示候选意图的索引; 在候选意图生成后,引入冲突消解函数对可能存在冲突的候选意图的综合置信度进行调整,使冲突强度大的候选意图的综合置信度下降; 冲突消解函数为:;其中,表示调整后的候选意图的综合置信度;表示语音模态下候选意图与其他候选意图的冲突强度;表示唇形模态下候选意图与其他候选意图的冲突强度; 通过安全约束规则,判断该候选意图在当前环境感知参数下是否允许被执行;逐层筛选允许被执行的候选意图,选择综合置信度最高且满足安全约束规则的候选意图作为最终执行指令; 安全约束规则为:;其中,表示最终执行操作;表示综合置信度最高的候选意图;表示禁止执行,不触发任何座舱内的执行动作;表示安全约束函数布尔函数;表示候选意图被允许执行;表示候选意图被禁止执行; 协同响应单元,根据最终执行指令,控制智能座舱内部设备执行相应操作,并更新座舱动态上下文信息,生成多模态协同响应信号并输出。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市深航华创汽车科技有限公司,其通讯地址为:518000 广东省深圳市龙岗区平湖街道平湖社区富康路2号厂房506;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励