Board logo

标题: [文本处理] [分享]批处理版CHM to TXT格式转换工具 [打印本页]

作者: dailisishen    时间: 2009-11-9 15:57     标题: [分享]批处理版CHM to TXT格式转换工具

上次的大牛说了,单纯的批是不能够解决htm to txt的,参阅了一下Google,有sed与HtoX32c.exe可形成htm2txt,当然,我也测试了asp,以及php文件,以上两种文件均不能完全的清理掉脚本本身的代码,只能适用于HTM与HTML文件。
昨晚架设完IIS7.5之后,浏览了一下以前的批处理,从垃圾堆了翻出这个加以修改了一下,发觉把以前做的班级主页静态页面改掉了,特下次决心重做了一个Prefect版本的,以下把代码贴出来,附随有HtoX32c.exe文件下载。。。
赶工写出来的,大家试着用用看吧。。。
  1. @echo off
  2. mode con cols=50 lines=10
  3. color a
  4. title CHM to TXT   BY:小死神 %date%
  5. echo 文件反编译中,请稍后。。。
  6. dir /b /a-d *.chm 2>nul
  7. if errorlevel 1 echo 请选择正确路径&pause&exit
  8. for /f "delims=." %%i in ('dir /b /a-d *.chm 2^>nul') do (
  9. hh.exe -decompile %%i文件 %%i.chm
  10. cd %%i文件
  11. copy ..\HtoX32c.exe HtoX32c.exe
  12. for /f "delims=. tokens=1,*" %%a in ('dir /b /s /a-d *.htm 2^>nul') do (
  13. if "%%b"=="htm" (
  14. HtoX32c.exe /ip "%%a.htm" > "%%a.txt"
  15. )
  16. if "%%b"=="html" (
  17. HtoX32c.exe /ip "%%a.html" > "%%a.txt"
  18. )
  19. del "%%a.%%b" /q /f >nul 2>nul
  20. )
  21. del *.hhc /q /f /s>nul 2>nul
  22. del *.hhk /q /f /s>nul 2>nul
  23. del HtoX32c.exe /f /q >nul 2>nul
  24. del *.gif /s /f /q >nul 2>nul
  25. cd ..
  26. )
  27. cls
  28. dir /b /a-d *.chm 2>nul
  29. echo                         文件编译完成,感谢使用!
  30. pause>nul 2>nul
复制代码
在这里谢谢那位不知名的水牛,还有汉化HtoX32c.exe文件的大大
作者: dailisishen    时间: 2009-11-9 16:00

hhc,hhk,hhp文件我只删除了索引与目录文件,至于怎么提取目录里的信息重命名文件等以后再说吧,我这个真的是一点思路都没有的啊。。。
作者: dailisishen    时间: 2009-11-9 20:09

大家注意一下啊,对于htm2txt的文件,只有在当前目录下才能有效,否则提示找不到文件或者不属于批代码。。。

[ 本帖最后由 dailisishen 于 2009-11-11 11:52 编辑 ]
作者: icerice    时间: 2010-2-26 08:58

好东西啊············
作者: icerice    时间: 2010-2-26 09:01

这么好的东西,终于给我找到了。。。。




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2