Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种视频语音翻译方法、装置及电子设备,方法包括:从待翻译视频中提取出待翻译语音;根据待翻译语音,并基于待翻译视频的视频画面,确定待翻译语音对应的待翻译文本信息,待翻译文本信息包括至少一个待翻译文本块,各待翻译文本块对应有各自的时...
  • 本发明涉及智能语音交互技术领域,尤其涉及面向自动化营销的AI手机语音交互方法,包括通过并行识别用户情感状态与实时用户意图,把握用户状态,为个性化营销提供全面依据,提升营销针对性;通过动态构建并更新情感状态转移网络,提取关键指标,分析用户情感...
  • 本发明公开了一种基于多模态大模型的无人机自然语言控制与交互方法及系统,属于无人机交互领域,通过获取无人机当前的环境图像及用户语音指令并转换为文本;对文本指令信息进行意图分类,判定当前任务为飞行控制任务或问答交互任务;若为飞行控制任务,将环境...
  • 基于多设备语音唤醒竞争的数据处理方法、系统及介质,其包括接收含会话标识与语音参数的语音唤醒上报请求;根据会话标识判断是否存在唤醒竞争会话,若否,则创建会话、启动竞争时间窗口,将设备标识及语音参数加入候选设备集合;若已存在唤醒竞争会话,判断竞...
  • 本申请涉及一种流式动态混合专家语音识别方法、装置、设备及存储介质。所述方法包括:获取待处理的目标催收音频特征;将所述目标催收音频特征按时间帧流式输入所述编码器中;基于所述目标催收音频特征,动态计算所述动态混合专家编码模块中各专家子模块的网络...
  • 本发明公开一种危险驾驶干预方法及系统,其中,方法包括获取车载终端采集的驾驶行为相关多源数据以及危险事件上报信息,并基于统一时间基准进行对齐,得到融合输入数据;基于所述融合输入数据执行多变量风险评估,输出至少包括风险评分与风险类型的风险评估结...
  • 本发明提供了一种车载智能语音交互方法、装置、电子设备及存储介质,涉及语音交互技术领域,包括:获取车载环境中的多模态信息;多模态信息包括:语音信息、图像信息、车辆状态信息和环境信息;基于多模态信息进行多模态融合得到融合特征向量;基于融合特征向...
  • 本公开实施例公开一种信息交互方法、设备及程序产品,该方法包括响应于触发的第一交互操作,接收交互对象输入的第一语音内容作为第一输入信息;在第一输入信息满足第一执行条件的情况下,生成对应第一输入信息的附加信息,并接收交互对象对应附加信息输入的第...
  • 本发明的实施例提供了一种语义对比方法、装置、电子设备及存储介质,涉及语音处理领域,方法包括对车机的音频数据进行采集,其中,音频数据为车机基于用户语音的回答音频,确定音频数据的文本向量、语义特征以及音频特征,将用户语音、文本向量、语义特征以及...
  • 本申请公开了一种文本纠错方法、模型训练方法、装置、设备及存储介质,属于电子设备技术领域。该文本纠错方法包括:对接收到的第一语音数据进行语音识别,得到第一文本;基于第一信息和所述第一文本,得到所述第一文本的第一纠错文本,所述第一信息为基于第二...
  • 本申请实施例公开了一种人工智能交互方法、装置及电子设备,涉及人工智能技术领域。具体实现方案为:获取用户输入的自然语言信息后,基于客户端智能体与用户进行交互,对用户输入的自然语言信息进行需求感知,从而通过客户端智能体接入能够执行与感知到的用户...
  • 本发明公开了一种列车车底检测机器人的语音交互系统、方法及运维系统,属于轨道运维技术领域;该语音交互系统,包括:语音采集单元,采集用户语音指令;特征提取单元,用于对语音信号进行预处理并提取声学特征;语音匹配单元,内置有语音模板库,用于将提取的...
  • 本发明提供一种基于大模型的个性化语音克隆陪伴机器人系统及方法,涉及人工智能语音交互与情感计算技术领域,系统包括端侧和云端,方法包括:采集用户语音样本,进行初步特征提取;采用few‑shot学习算法微调TTS模型,生成个性化声音;输入多模态数...
  • 本发明涉及一种基于多模态交互的智能秤自适应操作引导方法,其中包括在智能秤上的货物存在变化后,通过语音交互模块采集用户语音,并提取有效指令;通过指令理解引擎对有效指令进行分析,并与本地的动作映射库预存模板进行对比;当有效指令与动作映射库预存模...
  • 本发明提供一种具有语音控制功能的手术动力系统,属于医疗器械领域。包括主机、手术动力手柄和刀具,主机设有语音控制单元,其与麦克风/拾音器和音响/喇叭连接,用于接收人员的语音指令并基于该指令控制系统功能切换或参数设置。语音控制单元包括语音控制和...
  • 本申请提供一种语音对话方法、装置、设备、介质及产品,涉及大数据技术领域。该方法,通过引入广播中间件实现寻址匹配消息的全局广播,摆脱了对注册中心中间件的依赖,避免了相关技术中频繁建立和断开HTTP短连接带来的较大网络开销。此外,通过第一通信通...
  • 提供应答系统以及应答方法。能够对输入声音进行自然的应答。应答系统(1000)具备:内容播放部(12、12A、12A~12D、1313A~13D),其播放内容(C);麦克风(11、11A~11D);其输入声音识别部(113),其识别输入到麦克...
  • 本发明涉及噪音环境语音识别技术领域,提出了基于大模型的外呼呼叫中心语音识别方法及系统,包括:采集通话语音并进行分帧处理,获取语音信号帧;获取语音信号帧的不同IMF分量,计算语音信号帧的第一特征值;将语音信号帧转换为梅尔语谱图,确定语音信号帧...
  • 本发明公开了语音响应方法和装置、电子设备。所述语音响应方法包括:采集当前的输入语音以及与所述输入语音相关联的多模态信息;将所述输入语音以及所述多模态信息输入至预设的语音指令仲裁模型,以通过语音指令仲裁模型判定所述输入语音是否为指令性语音;以...
  • 本申请公开了一种意图识别方法和装置、程序产品、存储介质和电子设备,其中,该方法包括:重复执行如下目标操作,直至基于解析结果确定出目标业务意图为止:对当前输入语音和历史输入语音执行语义解析操作,得到解析结果;在基于解析结果无法确定出目标业务意...
技术分类