批处理之家 - Powered by Discuz! Board

标题: [文件操作] 请教一个批量下载网页的问题？ [打印本页]

作者: DDDYJQ1 时间: 2014-5-17 23:03 标题: 请教一个批量下载网页的问题？

本帖最后由 DDDYJQ1 于 2017-8-26 23:06 编辑

F:\BIAO\TEST11.TXT内容为
http://zisea.com/zscontent.asp?uni=123105
http://zisea.com/zscontent.asp?uni=123106
http://zisea.com/zscontent.asp?uni=123107
http://zisea.com/zscontent.asp?uni=123108
http://zisea.com/zscontent.asp?uni=123109
http://zisea.com/zscontent.asp?uni=123110

批处理内容为
wget -P "F:\BIAO\11" -i "F:\BIAO\test11.txt" --html-extension -p -k

不知网站怎么回事，太快了就断开了，不能下载了，如何设定在批量下载的时候完成一下网页后，5秒后再下载下一个网页，不知能否实现，先谢了！

作者: QIAOXINGXING 时间: 2014-5-18 10:21

wget有一个等待的选项：
-w, --wait=SECONDS wait SECONDS between retrievals.
--waitretry=SECONDS wait 1...SECONDS between retries of a retrieval.

作者: DDDYJQ1 时间: 2014-5-18 10:56

谢了，是这样吗？
wget -P -W 5 "F:\BIAO\11" -i "F:\BIAO\test11.txt" --html-extension -p -k
可是没有看到运行

作者: DDDYJQ1 时间: 2014-5-18 20:11

请各位好心人再帮忙看看

作者: terse 时间: 2014-5-19 00:19

这样试呢

wget -P "F:\BIAO\11" -w5 -i "F:\BIAO\test11.txt" --html-extension -p -k
复制代码

作者: DDDYJQ1 时间: 2014-5-19 08:57

谢了，就是这样，很好用

作者: DDDYJQ1 时间: 2017-8-26 23:04

https://www.lszj.com/tag/jianghuating_3074_1.html
https://www.lszj.com/tag/jiangjieshi_29_1.html
这种格式的如何批量下载？
wget -P "F:\BIAO\11" -w5 -i "F:\BIAO\test11.txt" --html-extension -p -k不能用了

作者: DDDYJQ1 时间: 2017-8-27 21:19 标题: 请教一个批量下载网页的问题？

本帖最后由 DDDYJQ1 于 2017-8-27 23:09 编辑

F:\BIAO\TEST11.TXT内容为
https://www.lszj.com/tag/jianghuating_3074_1.html
https://www.lszj.com/tag/jiangjieshi_29_1.html
这种格式的如何批量下载？
wget -P "F:\BIAO\11" -w5 -i "F:\BIAO\test11.txt" --html-extension -p -k不能用了
请问一下要如何改进？

作者: 3518228042 时间: 2017-8-28 08:16

wget.exe损坏？丢失？还是怎么的，应该行的啊

作者: DDDYJQ1 时间: 2017-8-28 20:57

没损坏，也没丢失

作者: DDDYJQ1 时间: 2017-8-28 20:58

请问一下要如何改进？

作者: DDDYJQ1 时间: 2017-8-29 22:20

请各位大神帮忙想想！

作者: hlzj88 时间: 2017-8-29 22:55

wget --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" --no-check-certificate -c -t 0 -T 40 -i test11.txt
复制代码

测试下载成功
这一句有两个作用，1 仿浏览器访问，避免wget被拒绝 2 可以下载加密网页https，如果要区分，忘了，这是我用wget的标配语句。

作者: DDDYJQ1 时间: 2017-8-29 23:04

谢了，就是这样，谢谢

作者: DDDYJQ1 时间: 2018-4-10 22:49 标题: 请教一个批量下载网页的问题？

E:\BIAO\TEST1.TXT内容为
https://baike.baidu.com/item/1年
https://baike.baidu.com/item/2年
https://baike.baidu.com/item/3年
https://baike.baidu.com/item/4年
https://baike.baidu.com/item/5年
https://baike.baidu.com/item/6年
https://baike.baidu.com/item/公元前1年
https://baike.baidu.com/item/公元前2年
https://baike.baidu.com/item/公元前3年
https://baike.baidu.com/item/公元前4年
这种格式的如何批量下载？
wget -P "e:\BIAO\1" -w5 -i "e:\BIAO\test1.txt" --html-extension -p -k
不能用了
请问一下要如何改进？

作者: DDDYJQ1 时间: 2018-4-11 19:54

请各位帮忙看看，先谢了

作者: hlzj88 时间: 2018-4-20 06:17

回复 15# DDDYJQ1

这个应当对txt进行for获取最后的 1年等等，然后把整句链接给wget，令其下载链接并保存为 1年等等的html，而不是用wget直接从文本读取链接。

欢迎光临批处理之家 (http://www.bathome.net/)