在《文档数字化采集与智能处理:图像弯曲矫正技术概述》一文中,我们介绍了文档图像矫正技术的发展沿革与代表性方案。随着文档智能处理的需求逐步升级,文档图像去畸变技术也在不断探索新的可能性。
今天,我们将讨论近年来文档图像矫正任务的前沿进展,分享一些我们正在关注的方向,欢迎与我们共同探讨、交流进步。
与 DocTr 框架相比,模型改进主要体现在以下方面:
合合信息推出了高性能文档图像矫正系统,能很好地矫正复杂的背景、更多类型的真实场景形变图像,为文档识别与解析提供更易于处理的输入图像。
系统链接为:https://www.textin.com/market/detail/crop_enhance_image
从早期单纯使用几何方法到如今深度学习与几何先验、光照建模、多模态感知等多种思路的结合,文档图像弯曲矫正(去畸变)技术日益走向成熟。新一代方法不仅在弯曲矫正精度上不断提升,还更加关注在真实移动端场景下的部署效率与鲁棒性。
随着更多公开数据集的涌现与计算机视觉技术的快速迭代,文档矫正技术将逐步迈向更精确、更鲁棒、更易用的阶段,也为后续文档分析、信息提取等应用提供了重要支撑。
Reference
[1] Hao Feng, Yuechen Wang, Wengang Zhou, Jiajun Deng, Houqiang Li. "DocTr: Document Image Transformer for Geometric Unwarping and Illumination Correction." In Proceedings of the 29th ACM International Conference on Multimedia (MM ’21), October 20–24, 2021, Virtual Event, China.
[2] Hao Feng, Shaokai Liu, Jiajun Deng, Wengang Zhou, Houqiang Li. "Deep Unrestricted Document Image Rectification." arXiv preprint arXiv:2304.08796, 2023.
[3] Weiguang Zhang, Qiufeng Wang, Kaizhu Huang. "Polar-Doc: One-Stage Document Dewarping with Multi-Scope Constraints under Polar Representation." arXiv preprint arXiv:2312.07925, 2023.
[4] Fangchen Yu, Yina Xie, Lei Wu, Yafei Wen, Guozhi Wang, Shuai Ren, Xiaoxin Chen, Jianfeng Mao, Wenye Li. "DocReal: Robust Document Dewarping of Real-Life Images via Attention-Enhanced Control Point Prediction." In Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), 2024.
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。