Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及政务服务技术领域,尤其涉及基于多模态验证的政务表单提交系统及方法,包括动态自适应语音采集模块采集用户语音信号并进行降噪增强处理,生成优化语音数据和语音质量评估向量;上下文感知复述模块基于语音质量评估向量调整语音识别置信度阈值,对优...
  • 本申请公开了一种金融机构的声纹认证方法、装置及存储介质。涉及金融科技领域,该方法包括:在获得目标用户授权的情况下,获取目标用户的音频信息,其中,音频信息中包括目标用户待认证的声纹;依据音频信息提取频谱特征、设备指纹和环境指纹;将频谱特征、设...
  • 本发明属于语音通信技术领域,具体为一种基于三组分解的语音通信方法即装置、设备。本发明方法包括:对输入语音信号进行三路并行特征提取,得到文本特征、韵律特征和音色特征;分别针对文本特征、韵律特征和音色特征进行文本压缩、韵律压缩和音色压缩,得到文...
  • 本发明提供了一种基于分级压缩的音频传输方法、设备及存储介质,该方法包括:监测与终端设备之间的网络状态;在接收终端设备传输的目标音频信号时,按照当前压缩等级将当前目标音频信号解压缩为原始音频信号;将当前原始音频信号编码为基础音频特征;在基础音...
  • 本申请涉及一种音频编码方法、音频解码方法、歌曲音频编解码方法、设备、介质和程序产品,涉及音频编解码技术领域,能够提高音频编解码质量。所述方法包括:获取待编码的原始音频信号;基于所述原始音频信号在时域上的子带分割结果,获取所述原始音频信号对应...
  • 本发明提供一种基于扩散模型残差块调制的深层鲁棒音频水印方法。该方法首先通过水印向量与时间步嵌入的融合构建条件调制信号;其核心在于扩散噪声预测网络的残差块中集成特征级线性调制模块FiLM,通过通道级缩放与偏移实现水印信息在多层级特征空间中的深...
  • 本发明涉及语音处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于双重语音表征的语音处理方法,包括:预先构建稀疏桥接编码器和稠密桥接解码器,并对所述稀疏桥接编码器和稠密桥接解码器进行联合训练;获取原始语音数据,对所述原始...
  • 本发明提供低功耗音频处理方法及系统,涉及音频处理技术领域,包括通过滑动窗口能量检测识别语音活动段与静音段;对语音活动段提取特征并分为高清晰度音节与低清晰度音节;对静音段提取背景噪声特征参数;监测低功耗蓝牙信道丢包重传次数,超阈值时丢弃低清晰...
  • 本申请涉及语音处理技术领域,具体公开了一种基于离散语音表示的口音转换方法、装置、设备及介质。本申请将待转换语音进行离散化处理,获得仅保留音素信息的语音单元,然后使用口音转换模型将语音单元映射为目标口音,去除了冗余特征,使得模型专注于口音转换...
  • 一种由一个或多个处理器执行的实时音频提升方法,包括接收与第一通道和第二通道相关联的音频输入信号,对该音频输入信号进行频带分割,以生成与该第一通道和该第二通道相关联的一组第一频率分量,以及与该第一通道和该第二通道相关联的一组第二频率分量,使用...
  • 本发明公开了一种供电营业厅语音处理及合规校验方法,通过独立的麦克风阵列分别采集用户与柜员的语音信号,并集成波束成形与自适应回声消除单元以提升目标语音信噪比;基于时延估计和阵列几何模型,计算各麦克风对之间的时间差,确定目标声源的方位角,对音频...
  • 本申请公开了一种延时估计方法、装置、存储介质和电子设备,方法包括:分别基于近端音频信号和缓存的多个远端音频信号,计算近端音频信号的宽带功率谱和各个远端音频信号的宽带功率谱;计算宽带功率谱之间的相干性,得到宽带相干值,并从中选择可用的宽带相干...
  • 本申请公开了一种氦氧环境下语音信号失真补偿方法及系统,其方法包括:对采集的原始音频流进行语音识别,得到语音段和非语音段;在非语音段,对原始音频流进行短时傅里叶变换,得到频域表示,计算得到环境背景气流噪声的功率谱;计算功率谱的对数斜率,将对数...
  • 本发明公开了一种面向具身智能的VLA模型语言指令噪声过滤与鲁棒性提升方法,旨在解决VLA模型对含无关上下文的自然语言指令敏感导致性能下降的问题。该方法包括:基于大语言模型的指令解析模块,用于接收含噪声的自然语言指令;噪声检测与过滤模块,通过...
  • 本发明公开一种针对带有AGC的设备的回声消除方法,包括以下步骤:步骤1:预设所述AGC的静态基准参数集,静态基准参数集作为动态调整AGC的参数的起始值,静态基准参数集包括目标增益、攻击时间和释放信号时长;步骤2:基于对设备的硬件接口所监控到...
  • 本发明涉及一种应用神经网络的鼓风机噪音检测系统,包括:噪音分析机构,用于基于不间断鼓风操作的鼓风机构在过往多天在同一目标时间区间分别对应的多份噪音数据以及鼓风机构的多项配置数据采用AI分析模型智能分析鼓风机构当天在目标时间区间内的平均噪音幅...
  • 本申请公开了一种音频信号增强方法、设备和存储介质,该方法包括:对麦克风阵列采集得到的多通道音频信号进行特征提取,得到所述多通道音频信号的若干频域特征参数;利用所述若干频域特征参数,确定所述多通道音频信号的瞬态功率谱密度和最优麦克风估计结果;...
  • 本发明公开了一种目标语音提取方法、系统及介质,属于多模态语音信号处理技术领域;包括以下步骤:给定混合语音与目标说话人唇部视频,提取语音对数功率谱、跨通道相位差及视觉时序特征;拼接多模态特征后输入改进的DPCRN网络,估计语音掩模并推导噪声掩...
  • 本发明公开了一种结合环境噪声评估的智能助听器降噪方法,涉及助听器信号处理技术领域,包括采集音频信号并转换至频域得到频域信号;从频域信号中提取噪声特征,计算噪声时变指数和频谱平坦度,识别环境噪声类型;估计噪声功率谱,根据环境噪声类型确定噪声追...
  • 本申请提供一种麦克风阵列语音降噪方法及相关设备,涉及语音降噪技术领域。本申请在通过信号分帧处理与短时傅里叶变换处理将目标麦克风阵列采集到的多路待降噪语音信号转换为多路原始频域信号后,会调用语音降噪模型对多路原始频域信号进行初步降噪处理,并根...
技术分类