在数字化时代,越来越多的文档正在被拍照、扫描成电子文档,但这个过程中时常出现漏字、错位等问题,这些问题的背后原因,是一个看似“冷门”的技术点——版面分析。版面分析是文档识别技术的重要环节,它可以帮助确定文档中的文字位置、字体、大小和排版方式等信息。然而,由于版面复杂多变、文本内容多样化等原因,版面分析技术仍存在着一系列的难题和挑战。
为了解决以上问题,合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技术,助力使用者从各类复杂的图片文档中精准获取信息。
从上世纪80年代开始,较多专门研究版面分析的工作成果开始涌现,此后经历了多番理念方法迭代。传统的版面分析方法在进行版面布局分析和表格处理时会明显受制于版式差异,在应对不同场景下的文档图片时泛化效果存在缺陷,而深度神经网络的引入有效解决了这些问题。
合合信息技术人员在采访中提到,得益于全卷积神经网络(FCN)和图神经网络(GNN) 的突破,文档版面分析的方法和性能得到了很大发展。公司基于深度学习的方法,结合文本区域的几何坐标、视觉特征、文本语义等多种模态信息对文本阅读顺序进行预测,显著提升分类结果。
同时,合合信息表格结构解析方法在逻辑版面分析中也发挥了重要作用,主要包括自上而下的方法、自下而上的方法以及端到端图像到标记的方法等。在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%;无线表识别中,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。
合合信息智能文字识别服务平台对存在图片、表格的复杂文档进行识别
目前,版面分析与OCR技术的结合在教育、商务和文化保护领域有着广泛的应用价值。它能自动识别和提取各种文档中的文本、图像、公式、表格等元素,帮助实现数字化处理和数据分析,简化相关工作流程。
然而,目前对于复杂版面文档和拍照变形文档的分析识别仍存在性能不足的问题,需要更多研究机构和科技企业的共同努力推动技术的理论研究和应用突破。合合信息将继续致力于版面分析相关技术的研究和开发,不断提高技术性能,为各领域的数字化处理和数据分析提供更加高效、准确的解决方案。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com