Board logo

标题: [文本处理] 请教一个批处理批量替换UTF-8字符的问题? [打印本页]

作者: DDDYJQ1    时间: 2015-5-11 23:31     标题: 请教一个批处理批量替换UTF-8字符的问题?

请问如何将同一文件夹下的*.HTML文件中的“☆☆”相应替换为TXT.TXT中的汉字,比如,在TXT.TXT中00002行对应"𠀋  ",便将00002.HTML中的“☆☆”替换成“𠀋  ”,00003行对应“冗  ”,便将00003.HTML文件中的“☆☆”替换成汉字表“冗  ”,并用UTF-8编码保存
先谢了
作者: CrLf    时间: 2015-5-12 00:54

本帖最后由 CrLf 于 2015-5-12 02:22 编辑

powershell
  1. $list = @{}
  2. get-content txt.txt | %{
  3. $split = $_ -split "\s+"
  4. $list += @{$split[0]=$split[1]}
  5. }
  6. foreach($file in dir *.html){
  7. (type $file) -replace "☆☆",$list[$file.BaseName] | out-file -encoding utf8 $file
  8. }
复制代码
hta
  1. <script src=http://www.bathome.net/lib/diy/Libs.js></script>
  2. <script>
  3. var liblist = ['hide','prototype','function','iconv']
  4. for(var i in liblist)Libs.get(liblist[i])
  5. </script>
  6. <script>
  7. try{md('处理后')}catch(E){}
  8. type('txt.txt').split(/\r?\n/)._each(
  9. function(line){
  10. try{
  11. var match = line.match(/(\S+)\s+(\S+)/)
  12. var text = type(match[1]+'.html').replace(/☆☆/g,match[2])
  13. iconv.saveText(text,'处理后/'+match[1]+'.html','utf-8')
  14. }
  15. catch(E){}
  16. }
  17. )
  18. alert('Bingo!')
  19. </script>
复制代码

作者: czjt1234    时间: 2015-5-12 06:10

看来也要学习powershell了
作者: DDDYJQ1    时间: 2015-5-12 19:30

谢谢了,能告诉我怎么用吗?是复制成两个.BAT吗?
作者: CrLf    时间: 2015-5-12 23:36

回复 4# DDDYJQ1


    第一个存为 .ps1,第二个存为 .hta
作者: DDDYJQ1    时间: 2015-5-12 23:52

谢谢了,可打开后汉字变成数字了,没有变成汉字,要加上“&#”才会变成Y变成汉字,我实在太菜了,没有办法弄好,再教我一下
作者: CrLf    时间: 2015-5-13 00:10

回复 6# DDDYJQ1


    怎么口能,你的 txt.txt 里第二列就没有汉字的好么
作者: DDDYJQ1    时间: 2015-5-13 00:18

都是好的汉字,都是EXT-B的汉字




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2