标题: [文本处理] 无聊之作批处理版 gbk2utf8 编码转换 [打印本页]
作者: plp626 时间: 2012-2-15 13:02 标题: 无聊之作批处理版 gbk2utf8 编码转换
本帖最后由 plp626 于 2012-2-15 13:34 编辑
- ::原理:gbk 转 unicode 然后 unicode 转 utf8
- :: unicode 转 utf8 算法:"b1=224|a1>>4,b2=128|a1%%16*4|a2>>6,b3=128|a2%%64"
- ::需要外部工具:fc.exe(系统默认自带),chcp.exe(系统默认自带)
- :: ascmap.cmd 下载 http://www.bathome.net/thread-12347-1-1.html
- :: hex.cmd 下载 http://www.bathome.net/viewthread.php?tid=12688
- ::用法: 所转换的文件命名为test.txt(默认ascii编码)存放在当前目录下,双击之即可
- ::其他: 该代码仅为实现功能,效率很低,仅适合小文本,有致命bug(看你能找到否?,呵呵);
-
- @echo off||code by plp
- setlocal enabledelayedexpansion
- cmd /u /c "type test.txt>test.tmp"||(pause&exit)
- call ascmap.cmd /437 $
- Set str=
- for /f "tokens=1-2" %%a in ('hex.cmd test.tmp 2')do (
- if %%b==00 (
- Set str=!str!!$:~0x%%a,1!
- )else (
- set/a a1=0x%%b,a2=0x%%a
- set/a "b1=224|a1>>4,b2=128|a1%%16*4|a2>>6,b3=128|a2%%64"
- for /f "tokens=1-3" %%c in ("!b1! !b2! !b3!")do (
- Set str=!str!!$:~%%c,1!!$:~%%d,1!!$:~%%e,1!
- )
- )
- )
- ECHO !str!>test-utf8.txt
- start test-utf8.txt
- pause
复制代码
期待 utf8 转 gbk (截除高位1110 10 10 字节)的诞生,大伙练练手。。
作者: zsl200911 时间: 2013-2-21 11:24
学习一下,很好
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |