我們在日常處理 TXT 文本的過程當中,常會遇到需要清理文檔中重複或者相似的多餘內容,可能是系統生成的一些標記、重複的數據條或是要統一清理的特定描述詞,但是基於 TXT 文件本身並沒有查重的功能,手動去查找這些類似的文件不僅浪費實際還容易出現遺漏的情況。 但我們可以藉助模糊匹配的方法,來快速識別文檔中與需要刪除關鍵字相似的段落,實現一個批量的刪除清理。
這裡就來為大家介紹如何利用公式模糊搜索出 TXT 記事本中多個相似的關鍵字詞,再統一的進行批量刪除,讓文檔的內容更加簡潔,來操作看看吧!
什麼情況要刪除 TXT 文件中多個結構類似的文字或是數字?
清理重複數據
處理程序生成的 TXT 文件常常會出現大量重複或者格式相同的數字以及文字記錄,假如需要刪除沒有用的重複信息,我們可以使用模糊匹配清理這些結構類似的內容,從而讓 TXT 數據文件更加簡潔,方便分析。
刪除批量編號
一些 TXT 數據文件當中,存在著大量沒有實際意義的編號或標註,單個刪除是十分繁瑣的,使用公式模糊搜索對應的編號可以快速批量刪除,提高數據的可讀性和處理效率。
去除模板化信息
在處理郵件或系統生成的 TXT 文件中,會有結構類似的模板內容,我們需要提取其中核心的信息,就要刪除掉這些模板化的重複內容,只保留特定的關鍵字詞,可以通過模糊查找出對應結構的文本或數字批量進行刪除。
模糊搜索批量刪除 TXT 中關鍵字詞的效果預覽
處理前:
處理後:
模糊搜索 TXT 中的關鍵詞並批量刪除的操作步驟
1、打開【核爍文檔批量處理工具】,選擇【文本工具】-【查找並替換文本中的關鍵字】。
2、在【添加文件】或【從文件夾中導入文件】中選擇一個方式添加需要刪除類似關鍵字詞的 TXT 文件,也可以直接將文件拖入下方添加,確認文件沒有問題後,點擊下一步。
3、進入選項設置界面,選擇【使用公式模糊查找文本】,在查找的關鍵字列表下方輸入正則表達式公式,替換後的關鍵字列表下方留空不輸入,最後再次點擊下一步。 然後點擊瀏覽,選擇好新文件的保存位置。
4、等待處理結束之後,點擊紅色路徑打開文件夾即可查看刪除關鍵字詞成功的 TXT 文件。