标题: [文件操作] xdoc2txt - 转换 doc/xls/pdf/html... 为 txt [打印本页]
作者: tmplinshi 时间: 2013-1-30 17:17 标题: xdoc2txt - 转换 doc/xls/pdf/html... 为 txt
xdoc2txt 不依赖于 Office。
Usage: xdoc2txt [-s|-e|-j|-u|-8][-f][-p] <filename...>
-s : convert to ShiftJIS(default)
-e : convert to EUC
-j : convert to JIS
-u : convert to UTF16(LE)
-8 : convert to UTF8
-f : output to file
-p : print property
-r=(0|1|2) : ruby style(0:suppress 1:parentheses 2:aozora bunko
-o=0 : other option; -o=0:no show PDF page#
-g=# : PDF gap parameter
-v : show version number
-x : output existing cell only(for EXCEL2007)
-i : use IFilter, if possible
示例:- xdoc2txt.exe -8 -f *.doc *.xls
复制代码
----------------------------------------------
官网: http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
----------------------------------------------
http://bcn.bathome.net/s/tool/index.html?key=xdoc2txt
作者: BAT-VBS 时间: 2013-1-30 20:05
感谢分享
作者: 小河都江堰 时间: 2013-1-30 20:47
谢谢分享,我收藏了
作者: Clarkky 时间: 2013-1-31 09:50
为什么所有README.txt都是乱码?
作者: tmplinshi 时间: 2013-1-31 12:30
本帖最后由 tmplinshi 于 2013-1-31 12:33 编辑
回复 4# Clarkky
是日文的。记事本似乎不能用日文编码 Shift-JIS 打开 txt。
试试其他的编辑器,如 AkelPad。
作者: h2bx86 时间: 2013-2-16 14:18
正好需要,谢谢了,。。
作者: sunhangmail 时间: 2013-5-24 23:39
谢谢,好用,但是好像打开excel文档会乱码,word和pdf可以使用
作者: tmplinshi 时间: 2013-5-24 23:57
回复 7# sunhangmail
试试这样:- xdoc2txt -8 "test.xls" | win_iconv -c -f utf-8 -t gbk
复制代码
win_iconv (http://bathome.net/thread-19842-1-1.html)
作者: sunhangmail 时间: 2014-4-5 18:15
回复 8# tmplinshi
谢谢,还是不行,依然乱码,到这个xdoc2txt的日本官网下载最新版本依然不行,只能支持doc和pdf等文件。
作者: 1e3e 时间: 2014-5-21 09:00
转换后为什么对数值全部取整数???
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |