在大会上,金山办公的技术总监熊龙飞发表了主题为《PDF内变形表格的识别与还原》的演讲。他展示了金山办公运用深度学习技术在PDF处理领域的最新突破,并以变形扫描PDF表格的还原作为实例,详细阐述了技术实现思路。
熊龙飞指出,当前市场上大多数PDF转化工具在处理标准PDF表格或清晰规整的表格时表现良好,但面对复杂场景下的表格,如严重变形、复杂布局、随机方向、像素模糊、印章或背景图案干扰、嵌套关系,乃至无表格线的情况,识别与转化效果不尽人意。针对这一挑战,金山办公开发了一套基于AI的识别系统,该系统采用自主研发算法,尤其在处理密集文本、不规则表格、带印章或签名的文档方面展现出卓越性能。
演讲中,熊龙飞通过展示一系列实验样本,展示了该系统在模糊图像、带有印章的表格图片,乃至被揉搓后展开的实体表格上的识别与还原能力。系统不仅实现了极高的还原度,还具备了编辑功能,显著提升了用户体验。
金山办公的AI技术整合于其产品WPS Office中,该产品包含了文字、表格、演示、PDF四大核心组件。其中,金山PDF作为一款功能强大的PDF编辑器,凭借AI技术的支持,用户只需一键操作即可编辑PDF文档内容,轻松实现PDF文档与其他常见文档格式之间的互转,无需额外下载任何软件,大大简化了工作流程。
AI技术的应用极大地提高了金山PDF的智能化水平,使得原本需要人工完成的复杂操作变得简单高效。自2016年发布以来,金山PDF凭借持续的AI技术创新,赢得了广泛用户的青睐,显著提升了用户的工作效率。
PDF Days Europe是由国际PDF协会举办的全球顶尖技术会议,该协会作为全球PDF行业的权威组织,负责推动PDF技术标准的制定和推广。金山办公作为协会成员,积极参与协会活动,旨在促进PDF技术生态的健康发展。未来,金山办公将继续加大研发投入,进一步提升在全球PDF技术生态建设中的影响力。