Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及人工智能技术领域,提供一种音频标注的方法、装置、电子设备及存储介质。所述方法包括:获取待处理音频;确定待处理音频中存在多人对话;根据多人对话的起始时间信息,确定待处理音频关联的对话时间线的起始时间点;从起始时间点开始,沿对话时间线...
  • 本发明公开了一种定制清洁任务的生成方法、生成装置及电子装置,包括:接收针对自移动设备进行清洁任务定制的语音指令;对语音指令进行解析,确定所述语音指令中是否包含第六预设关键词,其中,所述第六预设关键词用于指示清洁时间;在确定所述语音指令中包含...
  • 本申请提供了一种视听多模态的语音识别方法、模型训练方法以及电子设备。该语音识别方法包括:获取第一视频数据和第一音频数据;获取用于视听多模态的语音识别的目标模型,该目标模型包括第一目标网络,其中,该第一目标网络在深度信念网络DBN的基础上引入...
  • 本发明涉及智能语音处理技术领域,公开了一种基于AI语音的人机交互方法和系统。该方法获取用户语音并转换为数字波形信号;基于惠更斯原理构建语音空间模型,生成包含相位场和能量场的三维语音空间表示;对相位场进行涡旋结构探测,计算拓扑不变量,并依据其...
  • 本申请公开了一种融合噪声的语音数据集的构建方法、装置及存储介质。涉及人工智能领域,该方法包括:采集目标环境中的噪声数据;在语音片段的重叠区域中融合噪声数据中目标时长的噪声片段,得到融合噪声的语音数据集,其中,语音片段是初始语音集中的片段,初...
  • 本发明公开了一种基于命令词的误唤醒压制方法,通过获取语音数据;将语音识别结果分成命令词及非命令词;通过命令词与非命令词的汉字发声特性,将其分解成为更小的音素状态单元,并分别构建命令词及非命令词的音素状态路径,通过对应的音素状态路径计算出命令...
  • 文字报告生成方法,将各录制者于一事件中录制的多笔语音记录整合成一文字报告。首先,从多笔语音记录中分别识别出各自录制者的说话语音记录,并转换语音记录成包括说话句子以及时间戳记的多笔文字记录。接着,将多笔文字记录中和各自录制者说话语音记录符合的...
  • 本发明涉及一种基于不确定性的语音识别系统模糊测试方法,属于测试技术领域。本发明以少量标注语音为种子集,通过多算子语音变异生成大量候选样本,结合孪生网络相似度、BERT语义相似度与编辑距离等多角度语义一致性校验,筛除语义偏移样本。随后利用预测...
  • 本发明公开了一种同一语系下基于双基准载体与本质单元拆解的方言 / 口音万能转换方法及系统,涉及语言处理技术领域。该方法通过定位目标语系的 “官方标准发音”(发音基准载体)与 “法定规范文字”(文字基准载体),将所有方言 / 口音与标准发音的...
  • 针对扩散式语音转换的主动防御方法、装置、设备、介质,涉及语音安全技术领域。主动防御方法包含:获取源语音与参考语音,并在参考语音上引入受约束的保护扰动,构造受保护语音,并使保护扰动满足扰动不可感知约束。将源语音与受保护语音共同输入以参考语音为...
  • 本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种基于人工智能的语音生成方法、装置、设备及介质,包括:获取输入的文本数据并解析,生成文本序列;获取提示语音数据并编码,生成初始编码序列,基于动态码本对初始编码序...
  • 本发明涉及语音合成技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于偏好对齐的语音生成方法、装置、设备及介质,包括:获取预训练语音生成模型和偏好训练样本对,构建偏好对齐模型与非偏好对齐模型并以预训练模型为参考;基于偏好样本与非...
  • 本发明涉及语音语义技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种合成语音的质量分析方法、装置、设备及介质,所述方法包括:获取目标构音障碍者的初始音频和待合成语音文本,对初始音频进行音频编码,得到初始音频特征;根据初始音频特...
  • 本发明涉及语音语义技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种长文本数据的语音合成方法、装置、设备及介质,包括:获取长文本数据及对应的历史语音数据,提取全局文本语义特征和语音声学特征;对全局文本语义特征和语音声学特征进行...
  • 本发明涉及语音语义技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于声学分支权重的语音合成方法、装置、设备及介质,包括:获取语音提示及目标文本,提取语音提示的声学嵌入和目标文本的文本嵌入,分析语音提示的声学特征确定声学分支权重...
  • 本申请提供一种语音克隆系统和方法,其系统包括数据预处理模块、特征提取模块、模型训练模块、推理生成模块、其中:数据预处理模块,用于对原始音频进行人声伴奏分离、音频切割和自动打标;特征提取模块,用于从音频中提取自编码特征和梅尔谱特征,并与文本长...
  • 本申请公开了一种语音合成方法及相关装置,涉及语音合成技术领域,包括:获取待合成文本的文本令牌序列,并初始化为输入序列,利用大语言模型基于输入序列预测目标码元的全局概率分布,利用输入序列尾部的一个以上数据单元的分布数据对目标码元的全局概率分布...
  • 本公开涉及一种降噪设备、机电设备和调试方法。该降噪设备包括多个声音采集单元,被配置为分别采集待降噪声源所发出的声音并转换为第一电信号;信号放大单元,被配置为将所接收的多个声音采集单元的第一电信号进行叠加,以及将叠加后信号按照目标放大系数放大...
  • 本申请公开了音频信号的啸叫抑制方法、装置、存储介质和电子设备,方法包括:控制终端接收智能设备发送的当前数据帧,所述当前数据帧包括所述智能设备采集的当前音频信号、所述智能设备的发送延时和最新获取的网络传播延时;所述控制终端基于所述发送延时、网...
  • 本发明涉及变压器降噪技术领域,特别是一种干式变压器的主动降噪系统及方法。该系统包括噪声采集器、控制器和信号产生模块;噪声采集器包含参考传声器与误差传声器,分别获取参考信号x(n)与误差信号e(n)。控制器对噪声信号进行频域特征提取,在多个候...
技术分类