中国科学技术大学周熠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学技术大学申请的专利一种提升大语言模型中段文本解析能力的强化训练方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121683809B 。
龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610186810.3,技术领域涉及:G06F40/30;该发明授权一种提升大语言模型中段文本解析能力的强化训练方法是由周熠;胡译心;王金旺;张燚钧;齐骥设计研发完成,并于2026-02-10向国家知识产权局提交的专利申请。
本一种提升大语言模型中段文本解析能力的强化训练方法在说明书摘要公布了:本发明公开了一种提升大语言模型中段文本解析能力的强化训练方法,涉及自然语言处理和生成式大语言模型领域,该方法包括:根据动态比例因子进行中段双窗口构造,基于窗口位置从原始长文本语料中进行提取与拼接,得到初步的训练样本;对初步的训练样本进行中段文本的信息密度评估,对初步的训练样本进行验证与优化,得到优化后的样本;将优化后的样本和更新后的位置标识序列输入大语言模型,并通过位置感知的中段损失加权机制实现对大语言模型的迭代训练,得到优化后的大语言模型。本发明能够使得模型在处理序列中间位置信息时的检索与理解准确率得到显著且均衡的提升,成功将原本凹陷的U型性能曲线拉平,攻克训练性能瓶颈。
本发明授权一种提升大语言模型中段文本解析能力的强化训练方法在权利要求书中公布了:1.一种提升大语言模型中段文本解析能力的强化训练方法,其特征在于,该方法包括: S1、通过贝塔分布生成动态比例因子,根据动态比例因子进行中段双窗口构造,得到窗口位置,基于窗口位置从原始长文本语料中进行提取与拼接,得到初步的训练样本,并生成位置标识序列; S2、基于初步的训练样本获取中段的文本内容,对文本内容进行词元出现频率估计,并生成局部信息熵,根据局部信息熵对初步的训练样本进行中段信息密度评估,通过信息密度评估结果触发自适应窗口漂移优化机制对初步的训练样本进行优化,得到优化后的样本,并同步生成更新后的位置标识序列; S3、将优化后的样本和更新后的位置标识序列输入大语言模型,并通过位置感知的中段损失加权机制实现对大语言模型的迭代训练,得到优化后的大语言模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学技术大学,其通讯地址为:230026 安徽省合肥市金寨路96号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励