Board logo

标题: [文本处理] 【已解决】如何批量将 带有BOM 的 UTF-8 格式的文本转换为 UTF-8 格式 [打印本页]

作者: 思想之翼    时间: 2023-4-13 14:58     标题: 【已解决】如何批量将 带有BOM 的 UTF-8 格式的文本转换为 UTF-8 格式

本帖最后由 思想之翼 于 2023-4-13 17:02 编辑

d:\Data\ 内有文件夹 000001...201376
每个文件夹内有若干带有 BOM 的 UTF-8 格式的文本
如何用批处理代码, 批量转换为 UTF-8 格式
作者: lancer    时间: 2023-4-13 15:01

bat应该不行,不过PowerShell应该可以,只是我最近刚开始研究PowerShell,还不知道怎么弄。。。
作者: 77七    时间: 2023-4-13 15:50

回复 1# 思想之翼回复 2# lancer

pcl版主发过
http://www.bathome.net/redirect.php?goto=findpost&ptid=35034&pid=165911

20多万个文件夹吗?PowerShell 可能效率高,但是我不会改遍历子目录
作者: buyiyang    时间: 2023-4-13 16:19

sed,其实就是删除前3个字节
  1. sed -i "1s/^\xEF\xBB\xBF//" *.txt
复制代码

作者: Batcher    时间: 2023-4-13 16:33

回复 4# buyiyang


    不知道楼主的文件是否有的带BOM有的不带BOM呢
作者: 思想之翼    时间: 2023-4-13 16:43

回复 5# Batcher

全部带BOM
作者: buyiyang    时间: 2023-4-13 16:45

回复 5# Batcher


    其实0xef,0xbb,0xbf这三个字节就是bom头,也是一个特殊的字符
作者: Batcher    时间: 2023-4-13 16:46

回复 6# 思想之翼


    试试4楼的方法吧,我觉得挺好。
作者: lancer    时间: 2023-4-14 09:36

回复 3# 77七


    刚学,有些看不懂。等我继续研究一下啊PowerShell再来看。。。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2