北京诺君安信息技术股份有限公司韩小西获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京诺君安信息技术股份有限公司申请的专利一种证照结构化数据提取方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121527783B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511744347.1,技术领域涉及:G06V30/20;该发明授权一种证照结构化数据提取方法及系统是由韩小西设计研发完成,并于2025-11-25向国家知识产权局提交的专利申请。
本一种证照结构化数据提取方法及系统在说明书摘要公布了:本发明提供了一种证照结构化数据提取方法及系统,应用于数据处理技术领域。本申请通过机读区首行前5字符及视读区特征确定版式,动态记录未配置新版式,生成新增版式配置和标注,完成新版式结构化数据提取,并实时更新训练数据集;采用三层次定位算法融合策略,以机读区信息为参照计算姓、名分组一致性得分、日期数据准确性得分、结构化数据获取比例、定位点偏差数值,采用预设优先度排序,同时运用霍夫变换、SIFT特征匹配处理图像偏差,生成定位处理综合结果;以校验后的机读区和视读区准确数据为参照,对异常证件数据进行自动修正与补全,生成待检测数据;基于目标双通道OCR模型对待检测数据进行处理,生成目标证照结构化数据。
本发明授权一种证照结构化数据提取方法及系统在权利要求书中公布了:1.一种证照结构化数据提取方法,其特征在于,包括: 获取证照图像数据,包括含光照不均、污渍、遮挡情况的各类证照图像,以及机读区首行前5位字符信息和视读区特征图片文字; 对图像进行预处理,运用取黑边、去噪、高斯模糊、锐化、去水印提升图像质量,构建机读区和视读区的训练数据集; 通过机读区首行前5字符及视读区特征确定版式,动态记录未配置新版式,生成新增版式配置和标注,完成新版式结构化数据提取,并实时更新训练数据集; 采用三层次定位算法融合策略,以机读区信息为参照计算姓、名分组一致性得分、日期数据准确性得分、结构化数据获取比例、定位点偏差数值,采用预设优先度排序,同时运用霍夫变换、SIFT特征匹配处理图像偏差,生成定位处理综合结果,包括三层次定位算法包括基准定位法,基于预先构建的版式模板,通过坐标映射关系直接定位证照信息要素;SVM检测法,利用支持向量机模型训练关键特征检测器,通过特征向量匹配识别信息要素区域;辅助信息定位法,通过关联信息辅助定位缺失或模糊的字段;其中,姓、名分组一致性得分的计算公式为;日期数据准确性得分的计算公式为;结构化数据获取比例的计算公式为; 定位点偏差数值的计算公式:; 以校验后的机读区和视读区准确数据为参照,对异常证件数据进行自动修正与补全,生成待检测数据; 基于由视读区专用的ResNet-Transformer混合架构识别模型和机读区专用的基于MRZ编码规范设计字符集约束的CRNN网络识别模型构成的目标双通道OCR模型对待检测数据进行处理,生成目标证照结构化数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京诺君安信息技术股份有限公司,其通讯地址为:100086 北京市海淀区大钟寺东路太阳园小区13号楼中嘉大厦3层301号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励