昆明理工大学张凤祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉昆明理工大学申请的专利一种面向医疗票据图像的文本检测与识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119323796B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411410815.7,技术领域涉及:G06V30/30;该发明授权一种面向医疗票据图像的文本检测与识别方法是由张凤祥;朱波;邱兰;刘子瑜设计研发完成,并于2024-10-10向国家知识产权局提交的专利申请。
本一种面向医疗票据图像的文本检测与识别方法在说明书摘要公布了:本发明涉及图像的文本检测与识别技术领域,具体地说,涉及一种面向医疗票据图像的文本检测与识别方法。其包括以下步骤:S1、通过特征增强模块对医疗票据图像进行特征增强,并重构医疗票据图像的表格结构;S2、重构表格结构后,进一步进行医疗票据图像的特征融合,形成预检测表格图像;S3、将预检测表格图像与视觉语言预训练模型MDETR集成来增强特征表达;S4、使用通过Attention机制改进的连接时序分类CTC方法从预检测表格图像中识别出文本区域;S5、将检测到的文本区域进一步通过SVTR网络和PP‑HGNet的融合模型进行深度分析。本发明设计通过特征增强、表格结构重构、特征融合以及与视觉语言预训练模型MDETR的集成,能够在复杂的医疗票据图像中识别出文本区域。
本发明授权一种面向医疗票据图像的文本检测与识别方法在权利要求书中公布了:1.一种面向医疗票据图像的文本检测与识别方法,其特征在于:包括以下步骤: S1、通过特征增强模块对医疗票据图像进行特征增强,并重构医疗票据图像的表格结构; S2、重构表格结构后,进一步进行医疗票据图像的特征融合,形成预检测表格图像; S3、将预检测表格图像与视觉语言预训练模型MDETR集成来增强特征表达; S4、使用通过Attention机制改进的连接时序分类CTC方法从预检测表格图像中识别出文本区域; S5、将检测到的文本区域进一步通过SVTR网络和PP-HGNet的融合模型进行深度分析; 所述S1中,通过特征增强模块对医疗票据图像进行特征增强,包括以下步骤: S1.1、将彩色医疗票据图像转换为灰度医疗票据图像,调整医疗票据图像的直方图; S1.2、通过高斯滤波算法平滑医疗票据图像,去除高频噪声,从处理后的灰度医疗票据图像中初步提取出包含表格结构的区域,并将提取的区域分割成多个小的区域块; S1.3、通过直方图拉伸方法增强医疗票据图像对比度,使用拉普拉斯算子来锐化图像边缘; S1.4、使用膨胀操作来增强图像中的水平线段; S1.5、根据医疗票据图像局部特性动态调整阈值,进行自适应二值化处理; S1.6、在每个区域块内应用霍夫变换来检测并重构水平线段,对检测到的行距进行通过K-means聚类算法聚类分析,并计算行距均值; S1.7、基于行距均值设定阈值u,使用膨胀操作进一步提取水平线段,基于行距均值设定阈值h,检测垂直线段,将检测到的水平线段与垂直线段融合,重构医疗票据图像的表格结构; 所述S2中,重构表格结构后,进一步进行特征融合,包括以下步骤: S2.1、使用自定义的核掩膜进一步处理图像; S2.2、再次对预提取的区域块应用膨胀操作,提取水平线段; S2.3、在预提取的区域块内再次应用标准霍夫变换,重构水平线段; S2.4、对重构后的水平线段再次进行聚类分析,求出行距均值; S2.5、基于行距均值设定阈值,提取垂直线段,进一步完善表格结构; S2.6、再次进行区域分块,并确定区域阈值m; S2.7、将各个分块区域的特征进行融合,并预提取轮廓,形成预检测表格图像; 所述S3中,将预检测表格图像与视觉语言预训练模型MDETR集成来增强特征表达,包括以下步骤: S3.1、使用形成的预检测表格图像作为输入,对预检测表格图像进行标准化处理; S3.2、将预处理后的预检测表格图像输入到MDETR模型中; S3.3、对图像特征和文本特征进行交互,并对图像特征进行编码; S3.4、对编码和交互后的特征进行解码并输出检测结果; S3.5、通过非极大值抑制NMS方法对模型MDETR输出的目标检测结果进行后处理; S3.6、使用模型MDETR提供的检测结果来进一步确认和细化表格的边界以及单元格的位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人昆明理工大学,其通讯地址为:650500 云南省昆明市呈贡区景明南路727号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励