Board logo

标题: [文本处理] [讨论]批处理怎样以会员身份下载论坛 的某些帖子 [打印本页]

作者: ▄︻┻═┳一    时间: 2011-5-7 20:33     标题: [讨论]批处理怎样以会员身份下载论坛 的某些帖子

打个比方,以下载本论坛的 文字消遣区的帖子为例, 怎么下载?
==========================
再难度大点的,如果我要下载 某个 会员
比如batman,或者batcher所发的帖子,我想这个要用到论坛的搜索功能,又如何让批处理把关键字传递过去?
==========================
三方工具体积不超过1M者皆可。最好限定在vbs,js,或者 curl,wget,grep,sed 等常用的命令行工具以内。
作者: Batcher    时间: 2011-5-8 09:29

无法从某个帖子的URL来判断它属于哪个版块,以下两个方法可行:
1、管理员连到数据库里面用SQL语句获取某个版块所有的帖子的URL
2、自己分析以下网页源代码,获取该版块所有的帖子的URL
http://bbs.bathome.net/forum-11-1.html
http://bbs.bathome.net/forum-11-2.html
http://bbs.bathome.net/forum-11-3.html
......
作者: plp626    时间: 2011-5-8 10:52

2# Batcher

咱们的论坛水区需要登录后才能访问。

具体论坛具体解决。
curl 可以部分满足楼主的要求,对于难度大的要求,期待高人解决。
  1. @echo off
  2. set login=http://bbs.bathome.net/logging.php?action=login
  3. md $tmp 2>nul&pushd $tmp
  4. curl "%login%"|find "formhash" >$.tmp
  5. set/p value=<$.tmp
  6. for /f "delims== " %%a in ("%value:*value=%")do Set value=%%~a
  7. set "postdata=formhash=%value%&&loginfield=username&loginsubmit=true&password=【密码】&username=【用户名】"
  8. curl -c cookie.txt -d "%postdata%" "%login%">nul
  9. curl -b cookie.txt http://bbs.bathome.net/forum-11-1.html > 11-1.htm
  10. start 11-1.htm
复制代码
参考http://bbs.et8.net/bbs/showthread.php?t=1000982
==================================
作者: CrLf    时间: 2011-5-8 11:11

不会,不过有时候不一定要用bat,用WebZIP也可以嘛
作者: plp626    时间: 2011-5-8 11:18

4# zm900612


没用过,但据我所知大多有名的离线下载整站的软件是针对静态网站




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2