較為敏感的 PDF 文件中都存在著發票單號、合同編號或訂單號等,這些編號格式統一,但是內容有的時候非常敏感,不宜對外展示,在分享的時候需要進行保護處理。 當面對著非常多的 PDF 文件,並且每個文件中都包含很多結構相似、格式固定的待修改或隱藏的編號,我們若是實用傳統的方式打開文件手動去查找編輯再去修改,過程極其繁瑣、耗費的時間長不說,更難以保證處理的完整和一致,很容易出現遺漏。
那是否有一種方法可以縮短我們處理的時間,準確識別出 PDF 文件中所有符合格式的編號,並且批量替換或隱藏呢? 本篇文章給大家介紹一個快速解決技巧,幫助我們批量處理文檔中所有格式相同的編號或單號信息,大幅提升處理 PDF 的效率和準確性。 讓我們一起來了解看看吧!
什麼時候要修改或隱藏掉 PDF 裡面的同格式的編號,例如手機號、物流單號等?
展示時保護隱私內容
PDF 中有物流單號、身份號碼或手機號碼等敏感信息,假如要把文件發送給客戶或公開發布,就必須把這些信息隱藏替換掉,避免其他人看到不對外展示的內容,我們可以通過自動識別同格式的編號並進行替換或遮擋來完成快速保護隱私。
示範文件不洩露信息
在經常需要進行展示的實際 PDF 文件中存在的編號、訂單號、快遞單號都可能是真實數據,直接展示會很不安全,將這些數字編號按照統一的格式自動處理掉,比如直接遮蓋或替換成 ******,就能夠讓文件既能正常展示,又不會洩露客戶和公司的真實信息。
歸檔處理敏感數據
同一個 PDF 文件需要在團隊內部共享、多部門流轉或長期保存時,其中的編號假如很敏感或和業務無關,就需要統一進行隱藏,我們可以自動識別同時格式的數據並替換,能避免人工去修改,並且也不會破壞文檔的格式。
將 PDF 中多個編號批量替換成其它內容的效果預覽
處理前:

處理後:

方法一:使用核爍文檔批量處理工具將 PDF 中的物流單號批量隱藏
推薦指數:★★★★★
優點:
- 功能多、處理效果好,操作簡單易懂,小白也能夠快速上手,並且支持批量處理。
- 文件不會帶有上傳的性質,均在本地電腦處理,保護用戶的隱私。
缺點:
- 只能安裝在電腦中操作。
操作步驟:
1、打開【核爍文檔批量處理工具】,選擇【PDF 工具】-【查找並替換 PDF 中的關鍵字】。

2、在【添加文件】或【從文件夾中導入文件】中選擇一個方式將需要替換或隱藏關鍵字的 PDF 添加,也支持將文件直接拖入下方添加,然後點擊下一步。

3、進入到設置選項界面,選擇【實用公式模糊查找文本】,在下方需要查找的關鍵字列表輸入公式進行模糊搜索(例如這裡我們需要搜索出 UPS 格式的物流編號,就使用以下正則表達式),右側替換後的關鍵字列表輸入需要替換的文本即可,也支持輸入其它公式。 最後點擊下一步,接著點擊瀏覽,選擇好新文件的保存位置。

4、等待處理完成過後,點擊紅色的路徑打開文件夾,再打開 PDF 就能夠查看替換或隱藏成功的內容了。

方法二:使用 PDF 編輯器注釋覆蓋住 PDF 中需要隱藏的部分
推薦指數:★★★☆☆
優點:
- 操作直觀,無需學習複雜的功能。
- 幾乎任何 PDF 編輯器都有這個功能。
缺點:
- 手動一個一個操作,效率非常低。
- 容易出現漏掉的情況,並且無法處理大量的文件。
操作步驟:
1、使用編輯器打開 PDF 文件,在工具欄中找到注釋功能。

2、選擇矩形工具,在需要隱藏的編號上拖拽繪製,直到覆蓋住為止。

3、保存文件,重複操作所有頁面上的編號即可。
方法三:轉換為 Word 格式使用模糊搜索進行替換
推薦指數:★★★☆☆
優點:
- 真正完全的替換文本內容。
- 支持批量查找替換,並且適合大量編號的處理。
缺點:
- 較為複雜的 PDF 轉換可能會出現亂碼。
- 需要 Office 2016 版本及以上。
操作步驟:
1、用 Word 打開 PDF,按下 Ctrl H 打開替換窗口。

2、首先勾選通配符選項,接著查找內容下方輸入編號的公式,替換為下方輸入 ******。

3、最後另存為新的 PDF 文件後繼續處理下一個文件。
方法四:利用 Adobe Acrobat DC 搜索和替換功能
推薦指數:★★☆☆☆
優點:
- 相對手動遮蓋更高效,處理效果整潔。
- 可以處理所有相同格式的編號。
缺點:
- 對掃描 PDF 無效,可能會破壞原有的排版。
- 部分 PDF 軟件不支持搜索。
操作步驟:
1、使用 Adobe Acrobat DC 打開 PDF 文件,按下 Ctrl H 查找,輸入物流單號相同格式的前幾位,會自動出現對應的編號。

2、依次點擊,然後進行編輯修改。

3、然後切到下一個依次替換即可。
方法五:利用 Adobe Acrobat DC 搜索和替換功能
推薦指數:★★☆☆☆
優點:
- 完全自定義匹配的規則。
- 能處理超大型 PDF,並且可以導出結果列表。
缺點:
- 需要學習編輯基礎,學習成本較大。
- 不能直接修改 PDF 文件。
操作步驟:
1、安裝 Python 和 PyPDF 2 庫。
2、新建腳本文件:
Import re
Import PyPDF2
Pdf_file = open('input.pdf', 'rb')
Pdf_reader = PyPDF2.PdfReader(pdf_file)
# Match 11-digit mobile phone number
Phone_pattern = r'1[3-9]\d{9}'
For page in pdf_reader.pages:
Text = page.extract_text()
Phones = re.findall(phone_pattern, text)
Print(f"Found phone number: {phones}")
3、運行後輸出所有匹配的編號。