Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 成都信息工程大学;四川音乐学院乔少杰获国家专利权

成都信息工程大学;四川音乐学院乔少杰获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉成都信息工程大学;四川音乐学院申请的专利一种基于强化学习的短视频自动配乐方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116072090B

龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310033641.6,技术领域涉及:G10H1/00;该发明授权一种基于强化学习的短视频自动配乐方法及系统是由乔少杰;徐康镭;王文;韩楠;魏盛杰;黄江涛;林印吉;黄萍;李勇;刘志晟;郑龙吟;周倬屹;田野;郑皎凌;王邦平;王超;李耀;闵圣捷;余华设计研发完成,并于2023-01-10向国家知识产权局提交的专利申请。

一种基于强化学习的短视频自动配乐方法及系统在说明书摘要公布了:本发明公开了一种基于强化学习的短视频自动配乐方法及系统,该方法包括构建自适应视频编码器,提取视频深度特征;获取短视频配乐的MIDI文件,构建音频编码器,从MIDI格式文件提取多组音频特征向量集;将视频特征作为输入,音频特征向量集作为输出,构建基于强化学习的短视频配乐模型;根据强化学习配乐模型,设计采样方法得到配乐特征向量集;将配乐特征向量集解码为MIDI格式文件,完成短视频自动配乐。本发明解决了人工短视频配乐的选择困难、需要音乐背景知识和常识、音乐版权侵权等问题,大大提高短视频配乐的速度和质量,实现自动配乐。

本发明授权一种基于强化学习的短视频自动配乐方法及系统在权利要求书中公布了:1.一种基于强化学习的短视频自动配乐方法,其特征在于:包括以下步骤: 步骤S1:构建自适应视频编码器,提取视频深度特征; 步骤S2:获取短视频配乐的MIDI文件,构建音频编码器,从MIDI格式文件提取多组音频特征向量集; 步骤S3:将视频特征和音频特征向量集作为训练数据,构建并训练基于强化学习的短视频配乐模型;所述步骤S3包括: 步骤S301:将短视频配乐过程建模成特定的马尔科夫决策过程,定义状态、动作和奖励; 步骤S302:根据特定的马尔科夫决策过程,将视频特征与音频特征向量集作为训练数据,建立新型基于强化学习的短视频配乐模型; 步骤S303:训练上述强化学习模型,得到短视频配乐经验集; 步骤S302中建立基于强化学习的短视频配乐模型如下: 在强化学习框架下,将自动配乐系统当作智能体,并将短视频自动配乐过程建模成马尔可夫决策过程模型: 其中,步骤S301中所述的索引选择过程的状态、动作及奖励函数具体如下: 状态:指智能体当前的状态,即当前的音频特征向量集,其中,定义初始状态为音符参数编码、乐器参数编码、力度参数编码、节拍参数编码及控制器参数编码的第一位为1,其余位为0; 智能体:输入视频帧关键信息向量,通过自动配乐动作值函数,可输出相应的动作值,其中自动配乐动作值函数具体为: 其中,sigmoid和Leaky_Relu为激活函数,gt为包含t时刻视频帧关键信息的特征向量,i代表特征向量的第i位,yt1为t时刻第一层动作选择向量,w1、w2代表第一层动作选择的权重,b1、b2代表第一层动作选择的偏置;yt2为t时刻第二层动作选择向量,w3、b3分别代表第二层动作选择的权重和偏置;At为t时刻智能体动作向量,b4代表第三层动作选择的偏置,e1n、e21、e31、e41、e5n分别为智能体在音符参数、乐器参数、力度参数、节拍参数及控制器参数上的动作权重,其中的上标1和n分别代表智能体在该参数上的最大操作次数; 动作:指智能体在配乐特征向量集上所做出的修改,其中音符参数编码和控制器参数编码每次可修改多个值,乐器参数编码、力度参数编码和节拍参数编码每次最多将一个one-hot编码置为1; 奖励:智能体每次操作后的奖励被描述为rt,表示t时刻智能体操作与原音频特征向量的差异,奖励函数为: 其中,rt表示当前状态智能体获得的奖励值,sot表示步骤S203中t时刻的音频特征向量,sat表示t时刻智能体选择的音频特征向量,n为智能体连续操作的奖励计算长度,i表示原音频向量的第i位,j表示智能体操作向量的第j位; 智能体完成每次操作后,计算本次配乐的总奖励R,计算公式为: 其中,Rt代表当前步骤的总奖励,k为智能体操作的总次数,其大小取决于配乐的时长;rt为智能体本次操作获得的奖励,rt-1为智能体上一次操作所获得的奖励,d为本次操作对历史奖励的影响因子;当t为0时,R0=0,r0=0; 步骤S4:根据强化学习配乐模型,设计采样方法得到配乐特征向量集; 步骤S5:将配乐特征向量集解码为MIDI格式文件,完成短视频自动配乐。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都信息工程大学;四川音乐学院,其通讯地址为:610225 四川省成都市西南航空港经济开发区学府路一段24号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。