标题: [问题求助] 爬取vbsedit的所有范例,网站的Sample scripts页。 [打印本页]
作者: 窄口牛 时间: 2023-2-19 07:22 标题: 爬取vbsedit的所有范例,网站的Sample scripts页。
下载下来用英文命名,后续通过机器翻译将范例文件名均改为中文名称保存下来。
作者: jyswjjgdwtdtj 时间: 2023-2-19 09:49
你要这干啥。翻翻vbs程序员手册不就得了
作者: jyswjjgdwtdtj 时间: 2023-2-19 13:23
为啥你不自己爬啊 又不难 速度也不慢
还有直接上网看不就得了?
作者: 窄口牛 时间: 2023-2-19 16:22
就是保存点范例,vbs我是一点点也不会,范例用来拼凑自己要的功能。
作者: 窄口牛 时间: 2023-2-23 00:15
- 所列文件总数:
- 1438 个文件 1,358,822 字节
- 377 个目录 1,439,737,085,952 可用字节
复制代码
努力了两天多搞了一千多个出来,还有估计大几百,有点亏得慌,它的范例有的基于它的软件支持,还有的可能有问题,木法执行?
作者: jyswjjgdwtdtj 时间: 2023-2-23 18:45
回复 5# 窄口牛
爬虫不是自动化的吗?怎么会亏的慌
像demon我扔那里放了5分钟就好了
还有他的范例里用了他的东西,instr以下“vbsedit”,如果不等于一就是它独有的呗?
作者: 窄口牛 时间: 2023-2-23 20:09
不会爬,半手工搞,很费劲的。
作者: jyswjjgdwtdtj 时间: 2023-2-23 21:29
回复 7# 窄口牛
不是,那你搞回去demon的文章,然后留着收藏?里面有介绍怎么爬的啊?
作者: 窄口牛 时间: 2023-2-23 21:46
看不懂,只能取现成代码,想办法拼凑出自己需要的。
作者: idwma 时间: 2023-2-23 22:13
这些例子和微软脚本中心里是一样的吧
https://we.tl/t-bPYmOnq9tx
作者: 窄口牛 时间: 2023-2-23 23:17
嗯,差不多,稍微多一点点。
作者: went 时间: 2023-2-24 01:04
全部vbs脚本是吗,试试
test.bat 电脑win10以上- #&cls&cd /d "%~dp0" & @powershell -c "Get-Content '%~0' | Out-String | Invoke-Expression" &pause&exit
- cls
- function Parse-Content($whr,$url,$title,$p,$tab){
- $whr.Open('GET',$url,$false)
- $whr.Send()
- $s = $whr.ResponseText
- $whr.Abort()
- $a_list = $null
- if($s -match '(?s)(?<=<code class="classmyad">).*?(?=</code>)'){
- $a_list = $Matches[0] -split '\n' | Where-Object { $_ -match '^<a' }
- }
- Write-Host ($tab + $title)
- if($a_list -ne $null){
- $a_list | foreach {
- $arr = $_ -split '>|<|"'
- Parse-Content -whr $whr -url (($url -replace '/[^/]*$','/') + $arr[2]) -title $arr[4] -p ($p + '\' + $arr[4]) -tab ($tab + ' ')
- }
- } else {
- $vbs = '.\' + $p + '.vbs'
- $dic = [System.IO.Path]::GetDirectoryName($vbs)
- [void][System.IO.Directory]::CreateDirectory($dic)
- Write-Host ('{0}保存文件:{1}' -f $tab,$vbs)
- $Matches[0] -replace '(?s)<input.*?<font>','' -replace '<br>',"`r`n" -replace '(?s)<.*?>','' -replace ' ',' ' | Out-File $vbs
- }
- }
-
- $whr = New-Object -ComObject 'WinHttp.WinHttpRequest.5.1'
- Parse-Content -whr $whr -url 'https://www.vbsedit.com/scripts/' -title 'Scripts' -p 'Scripts' -tab ''
复制代码
作者: 窄口牛 时间: 2023-2-24 07:23
本帖最后由 窄口牛 于 2023-2-24 08:46 编辑
谢谢,已经手动搞完了。我会试试的,试后回来报告
作者: 窄口牛 时间: 2023-2-24 09:07
win7下也行,就是某些会出现错误文件夹,里面的vbs只有个<a了
作者: holley 时间: 2023-2-24 09:08
回复 12# went
可以正常使用,除了极少部分提示路径无法识别
作者: jyswjjgdwtdtj 时间: 2023-2-24 16:43
回复 15# holley
所以要用dom而不是正则啊
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |