Board logo

标题: [文本处理] 这样理解sed对不对 [打印本页]

作者: wanghan519    时间: 2024-4-23 16:36     标题: 这样理解sed对不对

今天遇到个问题,要把很多个文本里的0替换成1,文本很短,就1-2行,0也就出现一次,我就没多想用powershell大概这样写
  1. (gc a.txt) -replace '0','1' | out-file -encoding oem b.txt
复制代码
对大多数文件没出错
但是
有几个文件是二进制编码,但用记事本打开能看到一部分正常的字符
这替换出来就错了不少。。。
后来改成
  1. sed 's/0/1/' a.txt > b.txt
复制代码
暂时没有出错

就想问问大家,sed替换是不管字符编码的吗,这样理解是否正确,这种替换方式是否安全,是否需要把二进制的文件先转16进制数的表达方式,然后找到数字替换后再转回二进制?
谢谢啦
作者: Five66    时间: 2024-4-23 17:38

无非就2种
使用某一编码作为默认编码或自动判断编码
powershell是默认的
sed好像也是默认的,貌似会忽略无法解码的
作者: wanghan519    时间: 2024-4-23 17:48

回复 2# Five66


    多谢
又搜了一会,好像不同sed版本不太一样,不过powershell确实默认就解码了,然后就丢了一部分信息。。。
我这用的busybox sed,不管编码只是替换,用在这里方便一点

谢谢




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2