作为自创办以来的第三届年度盛会,本次程序员节以“算力新时代,开源创未来”为活动主题,由5大院士领衔,四城联动,开设十余场专业主题论坛。来自Linaro等开源组织的领导者和微软、腾讯、华为、合合信息等企业的技术专家接连登陆主论坛重磅活动《全体大会:2022技术英雄会》,与观众云端话科技。
合合信息智能创新事业部总经理唐琪受邀分享智能文档处理的技术优化方法及开源渠道介绍,获得了众多开发者的认可。
智能文档处理技术本质上是把文档里的信息从载体中剥离出来,将其对接到其他系统,以数据的流转实现流程自动化的技术。典型场景如单据的自动审核,就是先对单据进行图像检测,从中提取所需信息并录入到系统里,经过结构化处理,“翻译”成机器能理解的内容后再进行自动判别,达到节省人工成本、提高工作效率的目的。
唐琪在分享中指出,采集设备的不确定性和文档版式的多样性,导致文档在处理过程中经常遇到“看不清、看不准、认不全、难理解”四大类问题。合合信息在弯曲矫正、去摩尔纹(屏幕纹)等图像质量增强领域进行了深入研究,为信息的提取、存储、检索、管理等后续工作创造良好的环境。
在此次论坛上亮相的“合合信息智能文字识别服务平台”,是合合信息在制造业、金融业、物流业等30个行业应用里打磨出的核心技术产品。
(合合信息智能文字识别服务平台工作流程)
该平台提供了海量训练数据快速生成、自动化模型生成、完整的模型训练和测试等功能,具备低使用门槛、所需样本少、开发周期短的优势,使用者通过云端的简单操作,即可定制提取标准和非标准版式文档的结构化信息,仅需10张样本就可以开始训练。企业可通过简单的配置快速产出结构化识别模型,无需服务器资源与运维投入,便可获取技术支持,降低开发、部署与运维环节中的门槛。
实测中,应用人员依托该智能文字识别服务平台,最短可在10分钟内完成抽取模型开发全流程,可视化界面设计让没有算法基础的业务人员也可顺利使用。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com