PDF 格式通常具有優秀的跨平台顯示效果,但是內容進行編輯卻不如可以排版的文檔方便,當需要批量刪除多種相近表述的關鍵字詞內容並且文檔數量較多的時候,一般的查找替換方式很難滿足需求。 這時我們可以藉助模糊匹配的方法,來識別並刪除有著相似文字或數字的文本片段,有效的提升我們工作中文檔的處理效率。
接下來就為大家介紹怎麼去快速實現利用模糊匹配批量刪除 PDF 中相似的文字、數字的需求,讓 PDF 文件的清理工作得心應手,一起來和我試試吧!
什麼情況要模糊刪除 PDF 中的文字、數字等內容?
清理敏感數據
企業或機構公開發布或分享的 PDF 文件中,裡面涉及了用戶的個人信息,姓名、地址、身份號碼或電話號碼等內容需要進行模糊刪除,來防止信息被濫用或洩露。
隱藏機密信息
公司企業發布一些 PDF 合同、報價單或商品文件的時候,其中包含了價格、利潤或合作夥伴等信息,進行模糊刪除特定的文字或數字能夠防止競爭對於得到有用的內容,並且確保文件內容只能讓指定的接收者使用。
保護隱私內容
處理舊的 PDF 檔案文件時,存在著員工的舊薪資記錄、合同編號以及一些過期政策,一般為了保障檔案的可用性,模糊刪除部分敏感內容是非常有必要的。
批量刪除 PDF 里多個號碼、編號的效果預覽
處理前:
處理後:
利用模糊匹配批量刪除 PDF 中關鍵字詞的操作步驟
1、打開【核爍文檔批量處理工具】,選擇【PDF 工具】-【查找並替換 PDF 中的關鍵字】。
2、從【添加文件】或【從文件夾中導入文件】中選擇一個方式添加需要刪除關鍵字詞的 PDF 文件,也可以直接將文件拖入下方導入,然後點擊下一步。
3、選項設置界面選擇【使用公式模糊查找文本】,在下方查找的關鍵字列表輸入對應的正則表達式公式(假如不知道可以向 AI 詢問使用微軟.Net 框架生成),替換後的關鍵字列表下方留空不輸入,完成後再次點擊下一步。 接著進入保存界面,點擊瀏覽,選擇好處理好後文件的保存位置。
4、等待處理結束之後,點擊紅色的路徑,打開文件夾即可查看刪除成功的文件。