Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开一种危险驾驶干预方法及系统,其中,方法包括获取车载终端采集的驾驶行为相关多源数据以及危险事件上报信息,并基于统一时间基准进行对齐,得到融合输入数据;基于所述融合输入数据执行多变量风险评估,输出至少包括风险评分与风险类型的风险评估结...
  • 本申请涉及一种流式动态混合专家语音识别方法、装置、设备及存储介质。所述方法包括:获取待处理的目标催收音频特征;将所述目标催收音频特征按时间帧流式输入所述编码器中;基于所述目标催收音频特征,动态计算所述动态混合专家编码模块中各专家子模块的网络...
  • 基于多设备语音唤醒竞争的数据处理方法、系统及介质,其包括接收含会话标识与语音参数的语音唤醒上报请求;根据会话标识判断是否存在唤醒竞争会话,若否,则创建会话、启动竞争时间窗口,将设备标识及语音参数加入候选设备集合;若已存在唤醒竞争会话,判断竞...
  • 本发明公开了一种基于多模态大模型的无人机自然语言控制与交互方法及系统,属于无人机交互领域,通过获取无人机当前的环境图像及用户语音指令并转换为文本;对文本指令信息进行意图分类,判定当前任务为飞行控制任务或问答交互任务;若为飞行控制任务,将环境...
  • 本发明涉及智能语音交互技术领域,尤其涉及面向自动化营销的AI手机语音交互方法,包括通过并行识别用户情感状态与实时用户意图,把握用户状态,为个性化营销提供全面依据,提升营销针对性;通过动态构建并更新情感状态转移网络,提取关键指标,分析用户情感...
  • 本申请公开了一种视频语音翻译方法、装置及电子设备,方法包括:从待翻译视频中提取出待翻译语音;根据待翻译语音,并基于待翻译视频的视频画面,确定待翻译语音对应的待翻译文本信息,待翻译文本信息包括至少一个待翻译文本块,各待翻译文本块对应有各自的时...
  • 本申请提供了一种人工智能口播视频的口型检测方法、装置、设备及介质,属于图像数据处理技术领域。方法包括:获取口播视频,将口播视频分帧得到多个视频帧,并获取各视频帧的视频帧信息;识别口播视频中的多个音素,并确定各音素对应的若干视频帧;将各音素对...
  • 本申请提供一种基于在线OCR增强线上语音识别的方法及系统,涉及语音识别技术领域,方法包括:在线实时捕获协同会话中的共享数字图像,并提取其中的文本;对提取的文本进行分词处理,获得第一词汇集合;基于第一词汇集合,训练生成与协同会话对应的会话专属...
  • 一种基于大型语言模型的语音文本分析方法、装置及存储介质,该方法包括:对输入的第一语音数据进行静音段切除处理,得到第二语音数据;基于语音识别技术对所述第二语音数据进行重复内容合并处理,得到第一文本数据;基于预设的专用术语库和数字编码规则,对第...
  • 本发明提供一种大屏语音助手的多场景自适应AI语音识别方法和装置,其方法包括以下步骤:步骤一,构建大屏专用多模态语音指令数据集,按分层抽样策略划分为训练集、验证集与测试集;步骤二,基于所述训练集训练轻量级实时降噪模型,输出高保真的纯净语音特征...
  • 本发明涉及语音文本识别技术领域,具体涉及一种面向语音数据的语音文本识别方法及系统。本发明首先截取语音数据的语音帧,提取预测词边界帧和每帧的语义标签,将语音划分获得语义片段;进一步根据每个语义片段的Mel频谱图内的能量分布获取重要性系数,再结...
  • 本发明公开了面向动态声纹的智能音箱能效协同调度方法及系统,涉及智能音箱技术领域。该面向动态声纹的智能音箱能效协同调度方法及系统,包括S1,采集并预处理音箱运行过程中的声学结构数据、运行消耗数据与链路配置数据,构建标准化声纹状态数据集;S2,...
  • 本发明涉及人工智能与语音识别技术领域,公开了基于人工智能的玩偶公仔智能语音识别方法及系统,该方法包括:通过多麦克风阵列采集音频;本地执行语音增强、声学特征提取与轻量化唤醒词检测;启动本地语音识别并评估语义置信度,仅在置信度不足时上传脱敏数据...
  • 本发明涉及政务服务技术领域,尤其涉及基于多模态验证的政务表单提交系统及方法,包括动态自适应语音采集模块采集用户语音信号并进行降噪增强处理,生成优化语音数据和语音质量评估向量;上下文感知复述模块基于语音质量评估向量调整语音识别置信度阈值,对优...
  • 本申请公开了一种金融机构的声纹认证方法、装置及存储介质。涉及金融科技领域,该方法包括:在获得目标用户授权的情况下,获取目标用户的音频信息,其中,音频信息中包括目标用户待认证的声纹;依据音频信息提取频谱特征、设备指纹和环境指纹;将频谱特征、设...
  • 本发明属于语音通信技术领域,具体为一种基于三组分解的语音通信方法即装置、设备。本发明方法包括:对输入语音信号进行三路并行特征提取,得到文本特征、韵律特征和音色特征;分别针对文本特征、韵律特征和音色特征进行文本压缩、韵律压缩和音色压缩,得到文...
  • 本发明提供了一种基于分级压缩的音频传输方法、设备及存储介质,该方法包括:监测与终端设备之间的网络状态;在接收终端设备传输的目标音频信号时,按照当前压缩等级将当前目标音频信号解压缩为原始音频信号;将当前原始音频信号编码为基础音频特征;在基础音...
  • 本申请涉及一种音频编码方法、音频解码方法、歌曲音频编解码方法、设备、介质和程序产品,涉及音频编解码技术领域,能够提高音频编解码质量。所述方法包括:获取待编码的原始音频信号;基于所述原始音频信号在时域上的子带分割结果,获取所述原始音频信号对应...
  • 本发明提供一种基于扩散模型残差块调制的深层鲁棒音频水印方法。该方法首先通过水印向量与时间步嵌入的融合构建条件调制信号;其核心在于扩散噪声预测网络的残差块中集成特征级线性调制模块FiLM,通过通道级缩放与偏移实现水印信息在多层级特征空间中的深...
  • 本发明涉及语音处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于双重语音表征的语音处理方法,包括:预先构建稀疏桥接编码器和稠密桥接解码器,并对所述稀疏桥接编码器和稠密桥接解码器进行联合训练;获取原始语音数据,对所述原始...
技术分类