中国林业科学研究院资源信息研究所张怀清获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国林业科学研究院资源信息研究所申请的专利一种大语言模型的生态参数及其驱动因子自动提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120910562B 。
龙图腾网通过国家知识产权局官网在2026-05-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511035651.9,技术领域涉及:G06F18/214;该发明授权一种大语言模型的生态参数及其驱动因子自动提取方法是由张怀清;谭晶维;刘洋设计研发完成,并于2025-07-25向国家知识产权局提交的专利申请。
本一种大语言模型的生态参数及其驱动因子自动提取方法在说明书摘要公布了:一种大语言模型的生态参数及其驱动因子自动提取方法,属于人工智能技术领域。获取生态学文献PDF,构建文本分块提示词,利用大语言模型解析生态学文献,并分段、重组,设计基于生态学规律的多层次提示词体系,驱动大语言模型提取生态参数结构中的生态参数及其驱动因子,基于表格数据进行生态参数融合与校正,统一时间、空间、单位标准,通过图片交互式提取,实现文献图片观测数据的半自动提取与人工标定,设计字段对齐提示词引导大语言模型自动对提取结果字段标准化,导入数据库,形成生态学标准化数据库。
本发明授权一种大语言模型的生态参数及其驱动因子自动提取方法在权利要求书中公布了:1.一种大语言模型的生态参数及其驱动因子自动提取方法,其特征在于,含有以下步骤:获取生态学文献PDF,构建文本分块提示词,利用大语言模型解析生态学文献,并分段、重组,设计基于生态学规律的多层次提示词体系,驱动大语言模型提取生态参数结构中的生态参数及其驱动因子,基于表格数据进行生态参数融合与校正,统一时间、空间、单位标准,通过图片交互式提取,实现文献图片观测数据的半自动提取与人工标定,设计字段对齐提示词引导大语言模型自动对提取结果字段标准化,导入数据库,形成生态学标准化数据库, 获取生态学文献PDF步骤,含有以下步骤:获取生态学文献步骤,基于预设的生态学研究目标及参数需求,设计检索关键词,从中国知网文献数据库检索下载相关PDF文献,作为后续解析和提取的基础, 解析生态学文献步骤,含有以下步骤:利用文本解析技术将PDF转换为带有标题符号的Markdown格式文本,根据预设的标题符号对文本进行分块,并构建第一提示词输入大语言模型,引导其按照论文章节标题重组文本,输出涉及研究区概况、研究方法、结果与分析、讨论段落的标题,并通过自动关联获取对应内容,生成正文Markdown文本;表格、图片则通过识别关键字和正则表达式进行提取,并分别保存为表格Markdown和图片Markdown,表格信息包括表格标题和表格内容,图片信息包括图片标题和图片路径, 提取生态参数结构步骤,含有以下步骤:基于研究目标以及生态参数特征,设计遵循生态学规律的第二提示词,将正文Markdown与第二提示词一同输入大语言模型,使其深入理解正文内容,准确提取目标生态参数的具体观测值及其对应的驱动因子数据,驱动因子数据包括植被因子、气候因子、土壤因子、地形因子,植被因子包括植被类型、树高、胸径、林龄,气候因子包括温度、降水、风速,土壤因子包括土壤PH、土壤容重、土壤氮含量,地形因子包括海拔、坡度、坡向,并统一时间、空间、单位标准以确保匹配一致,提取结果形成元信息表、全数据表、生态参数时序观测表,并自动保存为Excel文件, 生态参数融合与校正步骤,含有以下步骤:通过规则筛选得到表格标题,设计第三提示词,引导大语言模型输出包含目标数据的表格编号列表,根据表格Markdown文本关联对应表格内容,形成由多个表格组成的新段落;基于生态参数结构提取步骤中得到的正文提取结果和新组成的表格信息,设计第四提示词,驱动大语言模型以正文提取结果为基准,融合表格信息,填补缺失数据、丰富生态字段维度,并再次对提取的结果进行校正,以得到更准确全面的结构化数据,校验后,对各驱动因子进行准确分类,将其划分为植被、气候、土壤、地形大类,最终生成新的元信息表、植被气候土壤地形因子表、生态参数时序观测表,并自动保存为Excel表格, 图片交互式提取步骤,含有以下步骤:通过规则筛选得到图片标题,设计第五提示词,引导大语言模型输出包含目标数据的图片编号列表,基于图片Markdown文本关联对应的图片路径,根据用户需求调用交互式提取工具,在自动弹出的图片界面中设定横纵坐标的刻度值,点击需要提取数据的位置,并基于图像刻度与像素比例换算得到真实值;数据提取完后调用存储工具,由用户设定横纵坐标的标题,保存时自动转为列名和行值,形成Excel表格, 导入数据库步骤,含有以下步骤:对提取生态参数结构步骤、生态参数融合与校正步骤、图片交互式提取步骤得到的各类Excel表格,经过人工核验无误后,创建对应的MySQL数据库表,将设计的第六提示词和Excel表头信息输入大语言模型,驱动其比对待存储Excel的字段与数据库已有字段,将同义以及相似字段设定为同一标准字段,新增数据库中不存在的字段,自动关联对应数据并导入数据库,形成能够直接对比、分析的标准化生态学数据库。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国林业科学研究院资源信息研究所,其通讯地址为:100091 北京市海淀区香山路东小府2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励