极度pdf-采用顶尖图文识别引擎ABBYY+Mathpix

发布日期:2022-08-04 10:12浏览次数:

极度 PDF-OCR Tools 工具箱是由成都微珑汇科技有限公司旗下的微智团队开发的一款强大的 PDF工具软件。


既可以快速地进行 PDF 的转换和操作,也可以对扫描版的 PDF 进行 OCR 识别,还能最大程度地保留文字、表格、段落和图片的样式。


产品下载地址

https://jidupdf.wlhex.com/

软件功能

公式OCR转换:将含有公式的PDF转换为WORD、LaTex(.Tex),保留公式和文字

                  普通OCR转换:将扫描版 PDF 转换为 WORD、EXCEL 或 PDF/A格式并保留图片样式表格和段落

PDF转换:将普通 PDF 文档(非扫描版)转换为 WORD、EXCEL、HTML、OFD等

                PDF操作:对 PDF 进行合并、拆分、压缩、分割、设置背景、添加水印、加密、去除密码等操作



顶尖的引擎 + 领先的算法 = 效率倍增


其中图文识别引擎是采用的国际知名公司 ABBYY,而PDF数学公式识别引擎是 Mathpix

IMG_8766(20211111-020305).JPG

极度 PDF 公式处理的优势是什么?


立刻出效果无需转换,极度 PDF 公式 OCR 处理后的 Word 文件里面的公式是原生的不依赖 MathType 和 AxMath 这些公式编辑器,也无需进行繁琐的嵌入转换工作,当然用户也可以很简单的将原生公式转换为你需要的 MathType 和 AxMath 公式。


跨平台的支持,极度 PDF 还支持 MacOs 客户端用户也可以直接将公式 PDF 文件转换成 Word 在苹果的专属文档编辑器 Pages 文稿中打开和编辑,这样在Mac系统上也可以便捷的处理公式 PDF 文件。


好的识别效果,我们采用了 NLP 纠错系统来核对 OCR 引擎中的文字结果是否正确,将识别错误的文字进行智能修正减少用户进行多次修正核对的时间,同时我们对复杂的公式处理能力也是表现良好的。


双栏的公式 PDF 支持,我们采用了自研的布局分析算法从 PDF 样本中分析出双栏内容,并在 LaTex 文件中进行双栏还原。


极度PDF有什么优势?

极度PDF采用了顶尖的引擎和自研的技术在PDF样本准确度,图文混排,公式处理上均有较大优势,在OCR识别处理方面与市面上便宜的PDF识别产品有本质的区别.



企业微信20220408-151043@2x.png

识别效果

image.png




会员权益:

*每天可以处理10页公式PDF「公式OCR」

*支持200页以内文件的普通OCR功能

*解锁全部功能

下载地址:https://jidupdf.wlhex.com/






极度PDF相关的Q&A表:https://www.wlhex.com/zixunzhongxin/jidupdf/61.html


(1).ABBYY(泰比)是全球领先的技术公司,包括西门子,富士通,爱普生,惠普,理光,富士,施乐,微软均在使用ABBYY公司的技术为客户带来优秀的用户体验.


(2).采用ABBYY引擎技术的落地产品价格也是十分昂贵其中Abbyy FineReaderd PDF 系列正版售价均在一千多人民币左右.


极度PDF支持整页公式PDF识别转换,帮助用户将扫描件等含公式的PDF材料转换为.Tex(LaTex),Word(保留文字和公式,需要手动简单排版)并且可以借助MathType和AxMath转换为相关的公式格式具体参考教程:https://www.wlhex.com/index.php/ask/view_28_8.html

如何使用公式PDF的OCR识别:

只需要在「OCR转换」-识别菜单选择「公式OCR」即可,如果不涉及公式可以直接选择「普通OCR」对排版和样式保留会比较出色,当然不支持公式



如果您有什么问题,欢迎咨询工程师 点击咨询