Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种助听器声场景分类方法、设备及介质,涉及音频信号处理技术领域,包括,基于基础分析特征,构建伪迹检测指标并进行伪迹触发判定,识别伪迹触发状态;当存在伪迹触发状态时,对当前帧信号进行高分辨率频谱分析,获取高分辨率频谱数据,根据当前...
  • 本申请实施例提供了一种面向语音质检的混合模型推理方法、装置、设备及介质。所述方法包括:对通话音频数据进行处理,生成结构化文本数据;调用轻量级模型对所述结构化文本数据进行处理,得到所述结构化文本数据对应的检测结果;所述检测结果包括:第一检测结...
  • 本发明提供一种基于发音流利度与认知流利度的口语流利度评测方法,应用于口语测评与人工智能技术领域,包括:获取待测者完成目标任务的语音音频;对语音音频进行指标计算,得到发音流利度和认知流利度;对发音流利度和认知流利度进行加权计算,得到待测者的口...
  • 本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至少语义表示为条...
  • 本发明公开了一种基于隐式运动迁移与音频感知的唇部同步方法,涉及计算机视觉与图形学技术领域;包括:从源身份图像中提取身份特征和源运动潜变量;基于驱动音频、风格参考视频及其音频、姿态和注视线索,生成风格感知的运动潜变量;通过隐式运动迁移和渲染,...
  • 本发明公开了一种基于语言模型的数字人生成系统及方法,涉及人工智能技术领域,该方法通过S1至S4的顺序处理流程,实现了从语音信号采集、共振峰频率提取、偏离分析、发音稳定性评估到动作补偿控制与三维动画融合的完整数字人发音建模路径。相较于现有仅基...
  • 本申请提供一种麦克风阵列语音降噪方法及相关设备,涉及语音降噪技术领域。本申请在通过信号分帧处理与短时傅里叶变换处理将目标麦克风阵列采集到的多路待降噪语音信号转换为多路原始频域信号后,会调用语音降噪模型对多路原始频域信号进行初步降噪处理,并根...
  • 本发明公开了一种结合环境噪声评估的智能助听器降噪方法,涉及助听器信号处理技术领域,包括采集音频信号并转换至频域得到频域信号;从频域信号中提取噪声特征,计算噪声时变指数和频谱平坦度,识别环境噪声类型;估计噪声功率谱,根据环境噪声类型确定噪声追...
  • 本发明公开了一种目标语音提取方法、系统及介质,属于多模态语音信号处理技术领域;包括以下步骤:给定混合语音与目标说话人唇部视频,提取语音对数功率谱、跨通道相位差及视觉时序特征;拼接多模态特征后输入改进的DPCRN网络,估计语音掩模并推导噪声掩...
  • 本申请公开了一种音频信号增强方法、设备和存储介质,该方法包括:对麦克风阵列采集得到的多通道音频信号进行特征提取,得到所述多通道音频信号的若干频域特征参数;利用所述若干频域特征参数,确定所述多通道音频信号的瞬态功率谱密度和最优麦克风估计结果;...
  • 本发明涉及一种应用神经网络的鼓风机噪音检测系统,包括:噪音分析机构,用于基于不间断鼓风操作的鼓风机构在过往多天在同一目标时间区间分别对应的多份噪音数据以及鼓风机构的多项配置数据采用AI分析模型智能分析鼓风机构当天在目标时间区间内的平均噪音幅...
  • 本发明公开一种针对带有AGC的设备的回声消除方法,包括以下步骤:步骤1:预设所述AGC的静态基准参数集,静态基准参数集作为动态调整AGC的参数的起始值,静态基准参数集包括目标增益、攻击时间和释放信号时长;步骤2:基于对设备的硬件接口所监控到...
  • 本发明公开了一种面向具身智能的VLA模型语言指令噪声过滤与鲁棒性提升方法,旨在解决VLA模型对含无关上下文的自然语言指令敏感导致性能下降的问题。该方法包括:基于大语言模型的指令解析模块,用于接收含噪声的自然语言指令;噪声检测与过滤模块,通过...
  • 本申请公开了一种氦氧环境下语音信号失真补偿方法及系统,其方法包括:对采集的原始音频流进行语音识别,得到语音段和非语音段;在非语音段,对原始音频流进行短时傅里叶变换,得到频域表示,计算得到环境背景气流噪声的功率谱;计算功率谱的对数斜率,将对数...
  • 本申请公开了一种延时估计方法、装置、存储介质和电子设备,方法包括:分别基于近端音频信号和缓存的多个远端音频信号,计算近端音频信号的宽带功率谱和各个远端音频信号的宽带功率谱;计算宽带功率谱之间的相干性,得到宽带相干值,并从中选择可用的宽带相干...
  • 本发明公开了一种供电营业厅语音处理及合规校验方法,通过独立的麦克风阵列分别采集用户与柜员的语音信号,并集成波束成形与自适应回声消除单元以提升目标语音信噪比;基于时延估计和阵列几何模型,计算各麦克风对之间的时间差,确定目标声源的方位角,对音频...
  • 一种由一个或多个处理器执行的实时音频提升方法,包括接收与第一通道和第二通道相关联的音频输入信号,对该音频输入信号进行频带分割,以生成与该第一通道和该第二通道相关联的一组第一频率分量,以及与该第一通道和该第二通道相关联的一组第二频率分量,使用...
  • 本申请涉及语音处理技术领域,具体公开了一种基于离散语音表示的口音转换方法、装置、设备及介质。本申请将待转换语音进行离散化处理,获得仅保留音素信息的语音单元,然后使用口音转换模型将语音单元映射为目标口音,去除了冗余特征,使得模型专注于口音转换...
  • 本发明提供低功耗音频处理方法及系统,涉及音频处理技术领域,包括通过滑动窗口能量检测识别语音活动段与静音段;对语音活动段提取特征并分为高清晰度音节与低清晰度音节;对静音段提取背景噪声特征参数;监测低功耗蓝牙信道丢包重传次数,超阈值时丢弃低清晰...
  • 本发明涉及语音处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于双重语音表征的语音处理方法,包括:预先构建稀疏桥接编码器和稠密桥接解码器,并对所述稀疏桥接编码器和稠密桥接解码器进行联合训练;获取原始语音数据,对所述原始...
技术分类