PDF 格式通常具有优秀的跨平台显示效果,但是内容进行编辑却不如可以排版的文档方便,当需要批量删除多种相近表述的关键字词内容并且文档数量较多的时候,一般的查找替换方式很难满足需求。这时我们可以借助模糊匹配的方法,来识别并删除有着相似文字或数字的文本片段,有效的提升我们工作中文档的处理效率。
接下来就为大家介绍怎么去快速实现利用模糊匹配批量删除 PDF 中相似的文字、数字的需求,让 PDF 文件的清理工作得心应手,一起来和我试试吧!
什么情况要模糊删除 PDF 中的文字、数字等内容?
清理敏感数据
企业或机构公开发布或分享的 PDF 文件中,里面涉及了用户的个人信息,姓名、地址、身份号码或电话号码等内容需要进行模糊删除,来防止信息被滥用或泄露。
隐藏机密信息
公司企业发布一些 PDF 合同、报价单或商品文件的时候,其中包含了价格、利润或合作伙伴等信息,进行模糊删除特定的文字或数字能够防止竞争对于得到有用的内容,并且确保文件内容只能让指定的接收者使用。
保护隐私内容
处理旧的 PDF 档案文件时,存在着员工的旧薪资记录、合同编号以及一些过期政策,一般为了保障档案的可用性,模糊删除部分敏感内容是非常有必要的。
批量删除 PDF 里多个号码、编号的效果预览
处理前:
处理后:
利用模糊匹配批量删除 PDF 中关键字词的操作步骤
1、打开【核烁文档批量处理工具】,选择【PDF 工具】-【查找并替换 PDF 中的关键字】。
2、从【添加文件】或【从文件夹中导入文件】中选择一个方式添加需要删除关键字词的 PDF 文件,也可以直接将文件拖入下方导入,然后点击下一步。
3、选项设置界面选择【使用公式模糊查找文本】,在下方查找的关键字列表输入对应的正则表达式公式(假如不知道可以向 AI 询问使用微软.Net 框架生成),替换后的关键字列表下方留空不输入,完成后再次点击下一步。接着进入保存界面,点击浏览,选择好处理好后文件的保存位置。
4、等待处理结束之后,点击红色的路径,打开文件夹即可查看删除成功的文件。