如何批量将带有 BOM 的 UTF-8 转换为 UTF-8

更新于:2022-05-15 21:46,编辑:sujing

概要:在我们的 Windows 操作系统当中,文本文件的编码是有非常多种的。比如常见的就有有 UTF-8、UTF-16、UTF-32、GBK、BIG5 等,而 UTF-8、UTF-16、UTF-32 还区分带 BOM 的以及不带 BOM 的。BOM 的全称为 byte-order mark,即字节顺序标记,它是插入到以UTF-8、UTF16或UTF-32编码Unicode文件开头的特殊标记,这些标记对于 UTF-8 来说并不是必须的,所以我们可以将带有 BOM 的 UTF-8 转换为 UTF-8。

BOM 对于 UTF-8 来说是可以不需要的,并且在有些时候带 BOM 的 UTF-8 在一些软件中使用的时候会出现未知的问题,所以我们需要去掉 UTF-8 的 BOM 头。如果需要将带有 BOM 的 UTF-8 转换为 UTF-8,也就是去掉 UTF-8 的 BOM 头,使用 Windows 上自带的文本编辑工具就可以完成,只需要在将文本文档另存为的时候选择对应的编码就可以了,如下图:

除了 Windows 自带的文本文档编辑工具,一般常用的文本编辑器也都是支持将带有 BOM 的 UTF-8 转换为 UTF-8的,所以这个操作对我们来说都不是问题。但是,这样去 BOM 头的方法只适合于对单个文件的操作,当我们面临大批量的文本文档都需要去 BOM 头的时候,我们就不得不去寻求一种更加高效、更加便捷、更加省心省力的方式来帮我们实现批量将带有 BOM 的 UTF-8 转换为 UTF-8 了,那怎么样才能够做到一次将所有的带有 BOM 的 UTF-8 文本文件转为 UTF-8 呢?今天我们就一起来看一种非常高效的方式,能够实现同时将多个带有 BOM 的 UTF-8 转换为 UTF-8,也能实现同时给多个 UTF-8 编码的文本文档添加 BOM 头。

我们打开「我的ABC软件工具箱」,按下图所示,左侧选择「文件内容」,右侧选择「修改文本文件编码」的功能。

就是上图所示的菜单,我们点击进去。进入之后第一步就是要选择我们的待处理的文本文档,也就是需要去 BOM 头的 UTF-8 的文档,可以一次选择多个。选择好之后我们就可以点击下一步进入到选项设置的界面。

这里【原编码】我们选择【自动识别】就可以了,由于我们是要去掉 UTF-8 的 BOM 头,所以新编码选择【UTF8_无BOM】。选择好之后就点击下一步进行输出目录的选择。

选择好输出目录之后我们继续点击下一步,软件就会开始帮我们进行批量将带有 BOM 的 UTF-8 转换为 UTF-8的操作了,是不是非常的简单呢?再多的文件也就是这一次操作即可,我们也能很快就得到我们需要的去掉了 BOM 头的 UTF-8 编码的文本文件了。