我们在日常处理 TXT 文本的过程当中,常会遇到需要清理文档中重复或者相似的多余内容,可能是系统生成的一些标记、重复的数据条或是要统一清理的特定描述词,但是基于 TXT 文件本身并没有查重的功能,手动去查找这些类似的文件不仅浪费实际还容易出现遗漏的情况。但我们可以借助模糊匹配的方法,来快速识别文档中与需要删除关键字相似的段落,实现一个批量的删除清理。
这里就来为大家介绍如何利用公式模糊搜索出 TXT 记事本中多个相似的关键字词,再统一的进行批量删除,让文档的内容更加简洁,来操作看看吧!
什么情况要删除 TXT 文件中多个结构类似的文字或是数字?
清理重复数据
处理程序生成的 TXT 文件常常会出现大量重复或者格式相同的数字以及文字记录,假如需要删除没有用的重复信息,我们可以使用模糊匹配清理这些结构类似的内容,从而让 TXT 数据文件更加简洁,方便分析。
删除批量编号
一些 TXT 数据文件当中,存在着大量没有实际意义的编号或标注,单个删除是十分繁琐的,使用公式模糊搜索对应的编号可以快速批量删除,提高数据的可读性和处理效率。
去除模板化信息
在处理邮件或系统生成的 TXT 文件中,会有结构类似的模板内容,我们需要提取其中核心的信息,就要删除掉这些模板化的重复内容,只保留特定的关键字词,可以通过模糊查找出对应结构的文本或数字批量进行删除。
模糊搜索批量删除 TXT 中关键字词的效果预览
处理前:
处理后:
模糊搜索 TXT 中的关键词并批量删除的操作步骤
1、打开【核烁文档批量处理工具】,选择【文本工具】-【查找并替换文本中的关键字】。
2、在【添加文件】或【从文件夹中导入文件】中选择一个方式添加需要删除类似关键字词的 TXT 文件,也可以直接将文件拖入下方添加,确认文件没有问题后,点击下一步。
3、进入选项设置界面,选择【使用公式模糊查找文本】,在查找的关键字列表下方输入正则表达式公式,替换后的关键字列表下方留空不输入,最后再次点击下一步。然后点击浏览,选择好新文件的保存位置。
4、等待处理结束之后,点击红色路径打开文件夹即可查看删除关键字词成功的 TXT 文件。