
- 帖子
- 247
- 积分
- 341
- 技术
- 15
- 捐助
- 0
- 注册时间
- 2012-9-21
|
[文本处理] 关于 文本编码的识别与输出(2016/2/3)
本帖最后由 wskwfkbdn 于 2016-2-3 16:23 编辑
Windows自带的记事本中常见的Utf-8 / Unicode / Ansi 几种编码,cmd控制台本身是可以显示 Unicode和Ansi/Gbk字符集,而Utf-8编码的文本就不支持了,type出来都是乱码,如果必要的话去处理文本内容,需要去Utf-8 -> Ansi才能够正常处理文本,于是乎,我就去研究了一阵编码与字符集的一些特征,终于实现了几种编码的识别,先来看看效果图吧!
原理:命令行自动识别出文本文件的编码,并转换ANSI字符输出,目前我暂时就实现这一功能,以后如果支持的人多了,也会考虑在这个一功能上面继续开发出 文本替换、编码转换、字符匹配 等基本功能。

点此下载 该文件 |
-
1
评分人数
-
|