Board logo

标题: [文本处理] 求助将网站源码指定内容输出 [打印本页]

作者: 309597483    时间: 2022-3-17 22:28     标题: 求助将网站源码指定内容输出

有偿:50元

我现在有N个URL,存放在1.txt里

批处理:判断URL源码中是否包含qq.com 这个关键词的链接

网页源码举例
<a href="https://jq.qq.com/?_wv=102700&k=123123" target="_blank"><img src="images/q1.png"></a>

如果包含,则输出 https://jq.qq.com/?_wv=102700&k=123123   保存到2.txt记事本中

1.txt中所有的URL都要分析,分析后输出到2.txt,一个一行


有会的加V:LHY7788945
作者: zaqmlp    时间: 2022-3-18 02:21

  1. <# :
  2. cls&echo off&cd /d "%~dp0"&mode con lines=5000
  3. powershell -NoProfile -ExecutionPolicy bypass "[IO.File]::ReadAllText(\"%~f0\",[Text.Encoding]::GetEncoding('GB2312'))|Invoke-Expression"
  4. pause
  5. exit
  6. #>
  7. $findword="qq.com";
  8. $txtfile1=".\1.txt";
  9. $txtfile2=".\2.txt";
  10. function gethtml($u){
  11.     $t='';
  12.     for($j=1;$j -le 3;$j++){
  13.         try{
  14.             $req=Invoke-WebRequest -Uri $u;
  15.             $t=$req.Content;
  16.             break;
  17.         }catch{
  18.             write-host ('第'+$j.ToString()+'次获取网页源码失败');
  19.             start-sleep -Seconds 3;
  20.         }
  21.     }
  22.     return $t;
  23. }
  24. $newfolder=".\源码";
  25. if(-not (test-path -literal $newfolder)){[void][IO.Directory]::CreateDirectory($newfolder);}
  26. $enc=[Text.Encoding]::GetEncoding('GB2312');
  27. $fs=New-Object System.IO.FileStream($txtfile2, [System.IO.FileMode]::Create);
  28. $sw=New-Object System.IO.StreamWriter($fs, $enc);
  29. $text=[IO.File]::ReadAllLines($txtfile1, $enc);
  30. for($i=0;$i -lt $text.count;$i++){
  31.     write-host $text[$i];
  32.     $html=gethtml $text[$i];
  33.     $outfile=$newfolder.trimend('\')+'\'+($i+1).ToString()+'.txt';
  34.     [Io.File]::WriteAllText($outfile, $html, [Text.Encoding]::GetEncoding('UTF-8'))
  35.     $m=[regex]::matches($html, 'href=[''"]?([^''" ]+)');
  36.     $isexist=$false;
  37.     foreach($it in $m){
  38.         if($it.groups[1].value.Contains($findword)){
  39.             $sw.WriteLine($it.groups[1].value);
  40.             $sw.Flush();
  41.             $isexist=$true;
  42.         }
  43.     }
  44.     if($isexist){
  45.         write-host 'match' -ForegroundColor green;
  46.     }
  47. }
  48. $sw.Close();
  49. $fs.Close();
复制代码





欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2