Board logo

标题: [文本处理] [已解决]批处理怎样批量复制网页上的信息? [打印本页]

作者: clemente123    时间: 2011-10-14 20:13     标题: [已解决]批处理怎样批量复制网页上的信息?

本帖最后由 CrLf 于 2011-10-15 16:30 编辑

有一堆网页:

http://oekoportal.de/portal/members/10027?keywords=fahrradersatzteile+fahrradwerkzeug+fahrradschloss+antrieb+bremsen
http://oekoportal.de/portal/members/10043?keywords=nlp+practitioner+master
http://oekoportal.de/portal/members/10044?keywords=duftlaedchen+online+shop+naturrein+naturreine
http://oekoportal.de/portal/members/10046?keywords=gesundheit+medizin+arzneimittel+beipackzettel+packungsbeilage
http://oekoportal.de/portal/members/10047?keywords=zugelassener+energiebeater+energieberatung+energiekonzepte+energieausweis
http://oekoportal.de/portal/members/10050?keywords=umweltmessungen+feng+shui
http://oekoportal.de/portal/members/10056?keywords=aetherische+oele+kba+fette
http://oekoportal.de/portal/members/10062?keywords=wellnessmassage+ganzkoerperwellnessmassage+taomassage+kraeuterstempelmassage+klangschalenmassage
http://oekoportal.de/portal/members/10079?keywords=trinkwasseraufbereitung+wasseraufbereitung+wasserbehandlung+wasserreinigung+wasserfilter
http://oekoportal.de/portal/members/10104?keywords=oeko+bio+natur+umwelt+oekologie
http://oekoportal.de/portal/members/10113?keywords=homoeopathie+prozessorientiert+systemische+aufstellungen+human
http://oekoportal.de/portal/members/10120?keywords=passivhaus+wasserspiele+raumgifte+oekohaus+schule

如何复制这些网页的内容全部到一个文本里? 只需要复制其中的文字即可,不用图片。

我现在是一个个的打开复制粘贴,好慢!

这个估计比较难,不知道有没有高人能做出来
作者: weichenxiehou    时间: 2011-10-14 20:51

本帖最后由 weichenxiehou 于 2011-10-14 20:53 编辑

回复 1# clemente123
其实很简单的,用两个三方工具就行了,curl.exe和htox32c.exe。
作者: sxw    时间: 2011-10-14 22:12

wget -i url.txt
ren *.* *.html
htox32c /IP *.html
作者: clemente123    时间: 2011-10-15 11:20

回复 2# weichenxiehou


    具体怎么操作呢?
作者: clemente123    时间: 2011-10-15 16:23

回复 3# sxw


    谢谢,但是楼上的那位高手帮我写好了。
作者: clemente123    时间: 2011-10-15 16:24

回复 2# weichenxiehou


    谢谢,太厉害了




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2