山东科技大学鲁法明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东科技大学申请的专利基于反事实和大语言模型的对比学习分子性质预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121506292B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610031044.3,技术领域涉及:G16C20/30;该发明授权基于反事实和大语言模型的对比学习分子性质预测方法是由鲁法明;祝一山;林泽东;包云霞设计研发完成,并于2026-01-12向国家知识产权局提交的专利申请。
本基于反事实和大语言模型的对比学习分子性质预测方法在说明书摘要公布了:本发明公开了一种基于反事实和大语言模型的对比学习分子性质预测方法,属于大语言模型与图神经网络相结合的分子表示学习技术领域,包括如下步骤:通过分子SMILES字符串生成原始分子图;生成骨架扰动图和官能团扰动图;确保所生成的扰动图为反事实硬负样本;通过大语言模型生成分子的自然语言描述,并用小语言模型将其转化为分子语义嵌入向量;在原始分子图、正样本和反事实硬负样本之间进行对比学习;将对比学习之后得到的原始分子图嵌入与分子语义嵌入融合,进行下游分子性质预测。本发明不仅能够通过反事实机制生成硬负样本,还可以通过大语言模型确保分子表征模式的多样性,显著提高对比学习在进行分子性质预测时的准确度。
本发明授权基于反事实和大语言模型的对比学习分子性质预测方法在权利要求书中公布了:1.一种基于反事实和大语言模型的对比学习分子性质预测方法,其特征在于,包括如下步骤: 步骤1、通过分子SMILES字符串生成原始分子图; 步骤2、基于原始分子图,分别采用骨架扰动与官能团扰动生成骨架扰动图和官能团扰动图;具体过程为: 步骤2.1、首先采用骨架扰动生成骨架扰动图;具体过程为: 步骤2.1.1、骨架扰动从原始分子图中提取支架图并将其转换为线图;具体使用开源工具包RDKit提取原始分子图的支架图并将其形成线图;其中,、、分别为线图的邻接矩阵、节点特征矩阵、边权矩阵;原始分子图中的每条边在线图中对应一个节点,、分别表示化学键所连接的两个原子节点的索引;如果原始分子图中的边和边之间有一个公共节点,则线图中对应节点之间生成边;表示化学键所连接的原子节点的索引; 步骤2.1.2、从线图中选择两个节点并映射到支架图的两个边; 步骤2.1.3、执行交换边操作以生成新的支架结构进而得到骨架扰动图; 步骤2.2、之后采用官能团扰动生成官能团扰动图;具体过程为: 步骤2.2.1、从原始分子图中随机选择一条边并打断它;其中、分别为选中边上的两个节点;为化学键的属性;对断开化学键的节点的氢原子数量进行更新: ; 其中,为更新后的值;为断开化学键的节点的氢原子数量;是断裂边的价态; 步骤2.2.2、随机选取两个不连通的节点,将它们连接起来,得到一条新的边,其中、分别为边上的两个节点;对连接了化学键的节点的氢原子数量进行更新: ; 其中,为更新后的值;为连接了化学键的节点的氢原子数量; 步骤2.2.3、当小于0时,对连接了化学键的节点的电子数进行更新: ; 其中,为更新后的值;为连接了化学键的节点的电子数; 步骤2.2.4、让,进而得到官能团扰动图; 步骤3、通过Frobenius范数与KL散度函数确保所生成的扰动图为反事实硬负样本; 步骤4、通过大语言模型ChatGPT生成分子的自然语言描述,并用小语言模型RoBERTa将其转化为分子语义嵌入向量,作为对比学习中的正样本; 步骤5、在原始分子图、正样本和反事实硬负样本之间进行对比学习,最大化正样本相似度并最小化反事实硬负样本相似度; 步骤6、将对比学习之后得到的原始分子图嵌入与分子语义嵌入融合,进行下游分子性质预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东科技大学,其通讯地址为:266590 山东省青岛市黄岛区前湾港路579号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励