Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京百度网讯科技有限公司王昆获国家专利权

北京百度网讯科技有限公司王昆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京百度网讯科技有限公司申请的专利文本识别方法、模型的训练方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114663886B

龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210198346.1,技术领域涉及:G06V30/148;该发明授权文本识别方法、模型的训练方法及装置是由王昆;余威设计研发完成,并于2022-03-01向国家知识产权局提交的专利申请。

文本识别方法、模型的训练方法及装置在说明书摘要公布了:本公开提供了一种文本识别方法、模型的训练方法及装置,涉及人工智能技术中的图像处理、深度学习以及自然语言理解。具体实现方案为:对获取到的待识别图像进行光学字符识别,得到待识别图像的初始的文字,对初始的文字进行分析处理,得到初始的文字的类别属性,若初始的文字的类别属性表征初始的文字为错误的文字,则对错误的文字进行纠错处理,得到用于纠正错误的文字的正确的文字,根据初始的文字和正确的文字,生成待识别图像的文本内容,避免了基于OCR识别技术造成的文字错误的弊端,提高了文本识别的准确性和可靠性的技术效果。

本发明授权文本识别方法、模型的训练方法及装置在权利要求书中公布了:1.一种文本识别方法,包括: 对获取到的待识别图像进行光学字符识别,得到所述待识别图像的初始的文字;所述初始的文字的数量为多个,每一初始的文字具有位置属性; 根据各初始的文字各自对应的位置属性,确定各初始的文字在所述待识别图像上的先后顺序,基于所述先后顺序,依次将各初始的文字输入至预先训练的文字位判别器,输出各初始的文字的各自对应的类别属性;其中,不同的类别属性通过不同的标志位标识,第一标志位用于表征错误的文字,第二标志位用于表征多余文字,第三标志位用于表征正确的文字; 若所述初始的文字的类别属性表征所述初始的文字为多余文字,则对所述多余文字进行剔除处理,以得到所述待识别图像的文本内容; 若所述初始的文字的类别属性表征所述初始的文字为错误的文字,则根据所述错误的文字得到候选集,并从所述候选集中获取用于纠正所述错误的文字的正确的文字;其中,所述候选集中包括用于替换所述错误的文字的纠错文字; 根据所述初始的文字和所述正确的文字,生成所述待识别图像的文本内容; 所述纠错文字的数量为多个;从所述候选集中获取用于纠正所述错误的文字的正确的文字,包括: 获取所述错误的文字的字体结构属性,并获取每一纠错文字的字体结构属性,其中,所述字体结构属性用于表征文字的笔画内容和笔画顺序; 针对每一纠错文字的字体结构属性,计算该纠错文字的字体结构属性与所述错误的文字的字体结构属性之间的相似度; 根据各相似度从各纠错文字中确定所述正确的文字。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦2层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。