Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供一种基于在线OCR增强线上语音识别的方法及系统,涉及语音识别技术领域,方法包括:在线实时捕获协同会话中的共享数字图像,并提取其中的文本;对提取的文本进行分词处理,获得第一词汇集合;基于第一词汇集合,训练生成与协同会话对应的会话专属...
  • 一种基于大型语言模型的语音文本分析方法、装置及存储介质,该方法包括:对输入的第一语音数据进行静音段切除处理,得到第二语音数据;基于语音识别技术对所述第二语音数据进行重复内容合并处理,得到第一文本数据;基于预设的专用术语库和数字编码规则,对第...
  • 本发明提供一种大屏语音助手的多场景自适应AI语音识别方法和装置,其方法包括以下步骤:步骤一,构建大屏专用多模态语音指令数据集,按分层抽样策略划分为训练集、验证集与测试集;步骤二,基于所述训练集训练轻量级实时降噪模型,输出高保真的纯净语音特征...
  • 本发明涉及语音文本识别技术领域,具体涉及一种面向语音数据的语音文本识别方法及系统。本发明首先截取语音数据的语音帧,提取预测词边界帧和每帧的语义标签,将语音划分获得语义片段;进一步根据每个语义片段的Mel频谱图内的能量分布获取重要性系数,再结...
  • 本发明公开了面向动态声纹的智能音箱能效协同调度方法及系统,涉及智能音箱技术领域。该面向动态声纹的智能音箱能效协同调度方法及系统,包括S1,采集并预处理音箱运行过程中的声学结构数据、运行消耗数据与链路配置数据,构建标准化声纹状态数据集;S2,...
  • 本发明涉及人工智能与语音识别技术领域,公开了基于人工智能的玩偶公仔智能语音识别方法及系统,该方法包括:通过多麦克风阵列采集音频;本地执行语音增强、声学特征提取与轻量化唤醒词检测;启动本地语音识别并评估语义置信度,仅在置信度不足时上传脱敏数据...
  • 本发明涉及政务服务技术领域,尤其涉及基于多模态验证的政务表单提交系统及方法,包括动态自适应语音采集模块采集用户语音信号并进行降噪增强处理,生成优化语音数据和语音质量评估向量;上下文感知复述模块基于语音质量评估向量调整语音识别置信度阈值,对优...
  • 本申请公开了一种金融机构的声纹认证方法、装置及存储介质。涉及金融科技领域,该方法包括:在获得目标用户授权的情况下,获取目标用户的音频信息,其中,音频信息中包括目标用户待认证的声纹;依据音频信息提取频谱特征、设备指纹和环境指纹;将频谱特征、设...
  • 本发明属于语音通信技术领域,具体为一种基于三组分解的语音通信方法即装置、设备。本发明方法包括:对输入语音信号进行三路并行特征提取,得到文本特征、韵律特征和音色特征;分别针对文本特征、韵律特征和音色特征进行文本压缩、韵律压缩和音色压缩,得到文...
  • 本发明提供了一种基于分级压缩的音频传输方法、设备及存储介质,该方法包括:监测与终端设备之间的网络状态;在接收终端设备传输的目标音频信号时,按照当前压缩等级将当前目标音频信号解压缩为原始音频信号;将当前原始音频信号编码为基础音频特征;在基础音...
  • 本申请涉及一种音频编码方法、音频解码方法、歌曲音频编解码方法、设备、介质和程序产品,涉及音频编解码技术领域,能够提高音频编解码质量。所述方法包括:获取待编码的原始音频信号;基于所述原始音频信号在时域上的子带分割结果,获取所述原始音频信号对应...
  • 本发明提供一种基于扩散模型残差块调制的深层鲁棒音频水印方法。该方法首先通过水印向量与时间步嵌入的融合构建条件调制信号;其核心在于扩散噪声预测网络的残差块中集成特征级线性调制模块FiLM,通过通道级缩放与偏移实现水印信息在多层级特征空间中的深...
  • 本发明涉及语音处理技术领域,可应用于医疗健康及金融科技等业务系统平台中,公开了一种基于双重语音表征的语音处理方法,包括:预先构建稀疏桥接编码器和稠密桥接解码器,并对所述稀疏桥接编码器和稠密桥接解码器进行联合训练;获取原始语音数据,对所述原始...
  • 本发明提供低功耗音频处理方法及系统,涉及音频处理技术领域,包括通过滑动窗口能量检测识别语音活动段与静音段;对语音活动段提取特征并分为高清晰度音节与低清晰度音节;对静音段提取背景噪声特征参数;监测低功耗蓝牙信道丢包重传次数,超阈值时丢弃低清晰...
  • 本申请涉及语音处理技术领域,具体公开了一种基于离散语音表示的口音转换方法、装置、设备及介质。本申请将待转换语音进行离散化处理,获得仅保留音素信息的语音单元,然后使用口音转换模型将语音单元映射为目标口音,去除了冗余特征,使得模型专注于口音转换...
  • 一种由一个或多个处理器执行的实时音频提升方法,包括接收与第一通道和第二通道相关联的音频输入信号,对该音频输入信号进行频带分割,以生成与该第一通道和该第二通道相关联的一组第一频率分量,以及与该第一通道和该第二通道相关联的一组第二频率分量,使用...
  • 本发明公开了一种供电营业厅语音处理及合规校验方法,通过独立的麦克风阵列分别采集用户与柜员的语音信号,并集成波束成形与自适应回声消除单元以提升目标语音信噪比;基于时延估计和阵列几何模型,计算各麦克风对之间的时间差,确定目标声源的方位角,对音频...
  • 本申请公开了一种延时估计方法、装置、存储介质和电子设备,方法包括:分别基于近端音频信号和缓存的多个远端音频信号,计算近端音频信号的宽带功率谱和各个远端音频信号的宽带功率谱;计算宽带功率谱之间的相干性,得到宽带相干值,并从中选择可用的宽带相干...
  • 本申请公开了一种氦氧环境下语音信号失真补偿方法及系统,其方法包括:对采集的原始音频流进行语音识别,得到语音段和非语音段;在非语音段,对原始音频流进行短时傅里叶变换,得到频域表示,计算得到环境背景气流噪声的功率谱;计算功率谱的对数斜率,将对数...
  • 本发明公开了一种面向具身智能的VLA模型语言指令噪声过滤与鲁棒性提升方法,旨在解决VLA模型对含无关上下文的自然语言指令敏感导致性能下降的问题。该方法包括:基于大语言模型的指令解析模块,用于接收含噪声的自然语言指令;噪声检测与过滤模块,通过...
技术分类