Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种音频信号增强方法、设备和存储介质,该方法包括:对麦克风阵列采集得到的多通道音频信号进行特征提取,得到所述多通道音频信号的若干频域特征参数;利用所述若干频域特征参数,确定所述多通道音频信号的瞬态功率谱密度和最优麦克风估计结果;...
  • 本发明公开了一种目标语音提取方法、系统及介质,属于多模态语音信号处理技术领域;包括以下步骤:给定混合语音与目标说话人唇部视频,提取语音对数功率谱、跨通道相位差及视觉时序特征;拼接多模态特征后输入改进的DPCRN网络,估计语音掩模并推导噪声掩...
  • 本发明公开了一种结合环境噪声评估的智能助听器降噪方法,涉及助听器信号处理技术领域,包括采集音频信号并转换至频域得到频域信号;从频域信号中提取噪声特征,计算噪声时变指数和频谱平坦度,识别环境噪声类型;估计噪声功率谱,根据环境噪声类型确定噪声追...
  • 本申请提供一种麦克风阵列语音降噪方法及相关设备,涉及语音降噪技术领域。本申请在通过信号分帧处理与短时傅里叶变换处理将目标麦克风阵列采集到的多路待降噪语音信号转换为多路原始频域信号后,会调用语音降噪模型对多路原始频域信号进行初步降噪处理,并根...
  • 本发明公开了一种基于语言模型的数字人生成系统及方法,涉及人工智能技术领域,该方法通过S1至S4的顺序处理流程,实现了从语音信号采集、共振峰频率提取、偏离分析、发音稳定性评估到动作补偿控制与三维动画融合的完整数字人发音建模路径。相较于现有仅基...
  • 本发明公开了一种基于隐式运动迁移与音频感知的唇部同步方法,涉及计算机视觉与图形学技术领域;包括:从源身份图像中提取身份特征和源运动潜变量;基于驱动音频、风格参考视频及其音频、姿态和注视线索,生成风格感知的运动潜变量;通过隐式运动迁移和渲染,...
  • 本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至少语义表示为条...
  • 本发明提供一种基于发音流利度与认知流利度的口语流利度评测方法,应用于口语测评与人工智能技术领域,包括:获取待测者完成目标任务的语音音频;对语音音频进行指标计算,得到发音流利度和认知流利度;对发音流利度和认知流利度进行加权计算,得到待测者的口...
  • 本申请实施例提供了一种面向语音质检的混合模型推理方法、装置、设备及介质。所述方法包括:对通话音频数据进行处理,生成结构化文本数据;调用轻量级模型对所述结构化文本数据进行处理,得到所述结构化文本数据对应的检测结果;所述检测结果包括:第一检测结...
  • 本发明公开了一种助听器声场景分类方法、设备及介质,涉及音频信号处理技术领域,包括,基于基础分析特征,构建伪迹检测指标并进行伪迹触发判定,识别伪迹触发状态;当存在伪迹触发状态时,对当前帧信号进行高分辨率频谱分析,获取高分辨率频谱数据,根据当前...
  • 本发明提供一种定标集确定方法、装置、电子设备及存储介质,涉及语音处理技术领域,该定标集确定方法包括:获取目标音频数据集,所述目标音频数据集包括多条作答音频;基于所述作答音频的多维度语义描述信息,分别提取所述作答音频的目标特征向量;对多个所述...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:通过初始视觉特征提取器对样本视频进行视觉特征提取,再进行特征映射,得到样本说话人视觉特征;然后对样本说话人视觉特征进行说话人...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:对目标语音进行编码,得到初始语音特征,并对目标人脸视频中的目标对象唇部进行编码,得到初始唇动特征;从视听关联模型中级联的N个...
  • 本发明公开了基于多维特征融合的广播播出音频异常检测方法及系统,属于音频信号异常检测技术领域,包括以下步骤:网络环境检测、多维特征融合和检测结果输出。本发明通过在广播播出过程中获取音频信号,并同步对网络环境进行实时监控,从而减少因网络波动造成...
  • 本发明属于人工智能与智能安防技术领域,具体地说是一种校园隐蔽区域异常语音传感与分类识别系统,包括分布式声学传感阵列、环境上下文感知、自适应信号调理、声源可信度评估、上下文增强型异常语音分类及隐私保护式数据处理模块。通过多模态环境感知与动态反...
  • 本发明公开了一种金融人工座席的风险防控方法及装置、电子设备,涉及金融科技领域或其他相关技术领域,其中,该方法包括:采集金融人工座席与客户之间交互的实时语音信号,从实时语音信号中提取多维度动态特征,其中,多维度动态特征包括声学特征、语义特征以...
  • 本申请公开了一种基于音视频融合的校园霸凌识别方法,涉及校园安全监测技术领域,该方法包括:在隐私区域内采集混合音频信号,将预处理后的混合音频信号输入至多人语音分离模型中,得到多条独立的说话人语音轨迹,并提取声纹特征;识别每条说话人语音轨迹中是...
  • 本申请实施例公开了一种基于音频信号的开关柜故障诊断方法,方法包括:获取所述开关柜的运行动作事件,并将运行动作事件划分为依次发生的多个储能释放机理阶段;采集开关柜的运行音频信号,并依据运行动作事件将所述音频信号映射至对应的储能释放机理阶段;针...
  • 本发明涉及电气测量技术领域,提出了一种蓝牙传输的电缆故障声纹监测预警方法及系统,所述方法包括:对电缆运行时的声纹信号进行时域帧化,得到时域声纹帧序列;对时域声纹帧序列进行变换,得到静态声纹特征向量,并对静态声纹特征向量进行计算,得到增强声纹...
  • 本发明涉及医疗健康与人工智能技术领域,具体涉及基于情绪语音感知训练提升老年人认知功能的系统及方法。包括:语音刺激呈现模块,控制目标语音刺激和掩蔽语音的播放;训练程序控制模块,控制并调整语音刺激呈现模块;反应采集模块,采集患者的反应并输出至反...
技术分类