Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 在一个实施例中,硬盘驱动器悬架的挠性件被放置在硬盘驱动器悬架的负载梁上。挠性件包括一个金属基座,该金属基座具有面向负载梁的第一表面和与第一表面相对的第二表面。该金属基座具有一个搭载部,该搭载部上安装有滑块;一个固定部,该固定部位于金属基座纵...
  • 本发明公开了一种基于周期同步自监督心肺解耦的肺音识别方法,包括以下步骤:获取单通道听诊音频训练样本集及待识别音频并预处理;对预处理信号进行时频分析得到时频特征;由时频特征计算心动周期信息表征;构建包含编码、解耦、解码重构与分类网络的心肺解耦...
  • 本发明公开一种基于多模态音频的养殖环境猪咳嗽识别方法、装置、设备及介质,包括获取生猪养殖现场的多个猪叫声音频片段;将多个猪叫声音频片段输入训练完成的猪咳嗽声音识别模型,得到猪咳嗽识别结果;其中,猪咳嗽声音识别模型训练的系统包括:多模态语谱图...
  • 本发明公开一种家畜异常声音现场识别方法、装置、设备及介质,包括:收集家畜舍内的家畜音频;将家畜音频转换为梅尔频谱图;将梅尔频谱图输入到家畜异常声音识别模型进行识别,模型训练过程为:基于多模态音频预训练框架将梅尔频谱图进行掩码操作;将掩码后的...
  • 本发明涉及医疗健康与人工智能技术领域,具体涉及基于情绪语音感知训练提升老年人认知功能的系统及方法。包括:语音刺激呈现模块,控制目标语音刺激和掩蔽语音的播放;训练程序控制模块,控制并调整语音刺激呈现模块;反应采集模块,采集患者的反应并输出至反...
  • 本发明涉及电气测量技术领域,提出了一种蓝牙传输的电缆故障声纹监测预警方法及系统,所述方法包括:对电缆运行时的声纹信号进行时域帧化,得到时域声纹帧序列;对时域声纹帧序列进行变换,得到静态声纹特征向量,并对静态声纹特征向量进行计算,得到增强声纹...
  • 本申请实施例公开了一种基于音频信号的开关柜故障诊断方法,方法包括:获取所述开关柜的运行动作事件,并将运行动作事件划分为依次发生的多个储能释放机理阶段;采集开关柜的运行音频信号,并依据运行动作事件将所述音频信号映射至对应的储能释放机理阶段;针...
  • 本申请公开了一种基于音视频融合的校园霸凌识别方法,涉及校园安全监测技术领域,该方法包括:在隐私区域内采集混合音频信号,将预处理后的混合音频信号输入至多人语音分离模型中,得到多条独立的说话人语音轨迹,并提取声纹特征;识别每条说话人语音轨迹中是...
  • 本发明公开了一种金融人工座席的风险防控方法及装置、电子设备,涉及金融科技领域或其他相关技术领域,其中,该方法包括:采集金融人工座席与客户之间交互的实时语音信号,从实时语音信号中提取多维度动态特征,其中,多维度动态特征包括声学特征、语义特征以...
  • 本发明属于人工智能与智能安防技术领域,具体地说是一种校园隐蔽区域异常语音传感与分类识别系统,包括分布式声学传感阵列、环境上下文感知、自适应信号调理、声源可信度评估、上下文增强型异常语音分类及隐私保护式数据处理模块。通过多模态环境感知与动态反...
  • 本发明公开了基于多维特征融合的广播播出音频异常检测方法及系统,属于音频信号异常检测技术领域,包括以下步骤:网络环境检测、多维特征融合和检测结果输出。本发明通过在广播播出过程中获取音频信号,并同步对网络环境进行实时监控,从而减少因网络波动造成...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:对目标语音进行编码,得到初始语音特征,并对目标人脸视频中的目标对象唇部进行编码,得到初始唇动特征;从视听关联模型中级联的N个...
  • 本申请提出的音唇同步检测方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融领域及医疗领域。该方法包括:通过初始视觉特征提取器对样本视频进行视觉特征提取,再进行特征映射,得到样本说话人视觉特征;然后对样本说话人视觉特征进行说话人...
  • 本发明提供一种定标集确定方法、装置、电子设备及存储介质,涉及语音处理技术领域,该定标集确定方法包括:获取目标音频数据集,所述目标音频数据集包括多条作答音频;基于所述作答音频的多维度语义描述信息,分别提取所述作答音频的目标特征向量;对多个所述...
  • 本发明公开了一种助听器声场景分类方法、设备及介质,涉及音频信号处理技术领域,包括,基于基础分析特征,构建伪迹检测指标并进行伪迹触发判定,识别伪迹触发状态;当存在伪迹触发状态时,对当前帧信号进行高分辨率频谱分析,获取高分辨率频谱数据,根据当前...
  • 本申请实施例提供了一种面向语音质检的混合模型推理方法、装置、设备及介质。所述方法包括:对通话音频数据进行处理,生成结构化文本数据;调用轻量级模型对所述结构化文本数据进行处理,得到所述结构化文本数据对应的检测结果;所述检测结果包括:第一检测结...
  • 本发明提供一种基于发音流利度与认知流利度的口语流利度评测方法,应用于口语测评与人工智能技术领域,包括:获取待测者完成目标任务的语音音频;对语音音频进行指标计算,得到发音流利度和认知流利度;对发音流利度和认知流利度进行加权计算,得到待测者的口...
  • 本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至少语义表示为条...
  • 本发明公开了一种基于隐式运动迁移与音频感知的唇部同步方法,涉及计算机视觉与图形学技术领域;包括:从源身份图像中提取身份特征和源运动潜变量;基于驱动音频、风格参考视频及其音频、姿态和注视线索,生成风格感知的运动潜变量;通过隐式运动迁移和渲染,...
  • 本发明公开了一种基于语言模型的数字人生成系统及方法,涉及人工智能技术领域,该方法通过S1至S4的顺序处理流程,实现了从语音信号采集、共振峰频率提取、偏离分析、发音稳定性评估到动作补偿控制与三维动画融合的完整数字人发音建模路径。相较于现有仅基...
技术分类