Board logo

标题: [原创代码] powershell 网页爬虫获取时光网电影数据库 [打印本页]

作者: gflrlm    时间: 2018-2-1 12:01     标题: powershell 网页爬虫获取时光网电影数据库

目的: 用powershell获取时光网所有的电影数据库 , 网址格式是 www.movie.mtime.com/$id/ , 其中$id 为时光网电影的id号 ,唯一标示。
最终生成的文件名字是all_database_movie.csv ,里面的格式为 《 ID;片名;更多片名;电影类型;国家地区》如下, 按照分号分割,用excel打开的时候选中第一列,然后选择“数据->分列->分割符合->分号->完成”可以显示到 每个表格,如图所示:

12556;Halloween(1978)万圣节 ;月光光心慌慌+抓鬼节+;恐怖+惊悚+;美国+;
12557;Halloween III: Season of the Witch(1982)万圣节3 ;月光光心慌慌3+鬼节+;悬疑+科幻+恐怖+;美国+;
12558;Halloween: Resurrection(2002)月光光心慌慌之大屠杀 ;战栗On-line+万圣节8:复活+;惊悚+恐怖+;美国+;
12633;Spider-Man(2002)蜘蛛侠 ;蜘蛛人+;动作+冒险+;美国+;
12634;Spider-Man 2(2004)蜘蛛侠2 ;蜘蛛人2+;动作+冒险+;美国+;


--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
使用方法:保存下面的代码为《000___mtime_抓取电影网页-选数据-逗号分列.ps1》, 然后设置以下参数:   
$start_id  表示要访问的时光网电影id,1是最小值。
$end_id 表示要访问  mtime 电影 id end , 貌似目前最大的ID = 249736
$web_request_enable 表示是否去访问mtime.com网页 ,因为有时候你可能已经访问过某个特定id的网页, 所以就不需要重复访问。每访问一个网页id,会生成一个id.txt文件,里面包含了网页源代码html格式。
$start_id_txt     表示需要解析的 mtime 电影 id start 12000
$end_id_txt      表示需要解析的 mtime 电影 id end  34002
// 由参数设置可以看出,访问mtime 和 解析 id.txt文件是可以独立分开的,提高速度。 后面我还会写一篇文章,采用并行处理方法来解析20万个id.txt!

  $start_id      = 12345                       # mtime 电影 id start
  $end_id        = 12500                       # mtime 电影 id end , 貌似目前最大的ID = 249736
  $web_request_enable = 1                  # 0: 不访问mtime    1: 访问mtime
  $start_id_txt  = 12000           # 需要解析的 mtime 电影 id start 12000
  $end_id_txt    = 34002           # 需要解析的 mtime 电影 id end  34002

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  1. $USING_PARAM_ENABLE=0
  2.   $Path ="D:\"
  3.   $Filter = '*.*'
  4.   $_Debug = 1
  5.   
  6.   Write-Host ""
  7.   Write-Host "请输入要搜索的文件夹路径:例如  D:\test"
  8.   if ($_Debug) {
  9.      $Path = "D:\迅雷下载\..torrents"
  10.   } else {
  11.      $Path = Read-Host
  12.   }
  13.   #if([String]::IsNullOrEmpty($Path))
  14.   
  15.   if(!(Test-Path $Path))
  16.   {
  17.      $Path =".\"
  18.      Write-Host "您输入文件夹路径不存在,取当前目录查找:Path = "$Path
  19.   }
  20.   Write-Host ""
  21.   Write-Host ""
  22.   Write-Host "Path   = " $Path
  23.   if ($_Debug) {
  24.      $MySearchString_tmp = "name\d+:(.*?):name"
  25.   } else {
  26.      Write-Host "请输入要搜索的字符串:"
  27.      $MySearchString_tmp = Read-Host
  28.   }
  29.   # D:\MyProject\ 指定要递归遍历查找的目录
  30.   # *.cs  要查找的文件
  31.   # myString 要查找的字符串
  32.   $found = 0;
  33.   #只显示文件,不显示文件夹
  34.   #$fileList = Get-ChildItem -Path $Path -Filter $Filter -Recurse | ?{$_.PsIsContainer -eq $false}| %{$_.FullName}
  35.   
  36. if($USING_PARAM_ENABLE){
  37.   Write-Host "start_id_txt_param = $start_id_txt_param"
  38.   Write-Host "end_id_txt_param   = $end_id_txt_param"
  39.   Write-Host "call_cnt           = $call_cnt"
  40.   $all_database_movie = ".\all_database_movie---$call_cnt.csv"
  41.   $all_database_movie_page_error = ".\all_database_movie_page_error---$call_cnt.csv"
  42.   $all_database_movie_page_404 = ".\all_database_movie_page_404---$call_cnt.csv"
  43. } else {
  44.   $all_database_movie = ".\all_database_movie.csv"
  45.   $all_database_movie_page_error = ".\all_database_movie_page_error.csv"
  46.   $all_database_movie_page_404 = ".\all_database_movie_page_404.csv"
  47. }
  48.   if((Test-Path $all_database_movie))  {
  49.     #Remove-Item $all_database_movie
  50.   }
  51.   if((Test-Path $all_database_movie_page_error))  {
  52.     #Remove-Item $all_database_movie_page_error
  53.   }
  54.   if((Test-Path $all_database_movie_page_404))  {
  55.     #Remove-Item $all_database_movie_page_404
  56.   }
  57.   $fileList = New-Object -TypeName System.Collections.ArrayList
  58. [color=Red]  $start_id      = 12345                       # mtime 电影 id start
  59.   $end_id        = 12500                   # mtime 电影 id end , 貌似目前最大的ID = 249736[/color]
  60. if($USING_PARAM_ENABLE){
  61.   $start_id_txt  = $start_id_txt_param           # mtime 电影 id start 12000
  62.   $end_id_txt    = $end_id_txt_param           # mtime 电影 id end  34002
  63. } else {
  64.   $start_id_txt  = 12000           # mtime 电影 id start 12000
  65.   $end_id_txt    = 34002           # mtime 电影 id end  34002
  66. }
  67.   $filter_txt    = "*.txt"                 # 选择要解析的电影文件名
  68.   $retry_cnt     = 0                       # 网页打不开的重新访问counter
  69.   $retry_times   = 4                       # 网页打不开的重新访问 retry 次数
  70.   $str_connection        = "+"             # item 连接符    ,例如: 美国+日本+中国
  71.   $str_connection_spaces = ";"             # fullname连接符 ,例如: 谍影重重;美国;动作+剧情
  72.   $web_request_enable = 1                  # 0: 不访问mtime    1: 访问mtime
  73.   $database_path="D:\mtime_database"
  74.   if ($web_request_enable) {                                 
  75.     for ($x=$start_id; $x -lt $end_id; $x++)
  76.     {
  77.       $retry_cnt=0
  78.       Write-Host "Processing : [url]http://movie.mtime.com/[/url]$x/"
  79.       if((Test-Path $database_path\$x.txt))   {
  80.         continue
  81.       }
  82.       do {
  83.            $webcontent=Invoke-RestMethod -uri [url]http://movie.mtime.com/[/url]$x/
  84.            #if($?){ #判断命令是否成功返回, 如果网址不存在或没有网络 则是false
  85.             $webcontent| Out-File $database_path\$x.txt
  86.            
  87.            #}else{
  88.             #write-host "@@@@@@@@@@@@@@@@@@@@@@@@@@@ ** ** @@@@@@@@@@@@@@@@@@@@@@@@@@@ "  -ForegroundColor red
  89.             #write-host "@@@@@@@@@@@@@@@@@@     网址不存在或没有网络 @@@@@@@@@@@@@@@@@@@@@ "  -ForegroundColor red
  90.             #write-host "@@@@@@@@@@@@@@@@@@@@@@@@@@@ ** ** @@@@@@@@@@@@@@@@@@@@@@@@@@@ "  -ForegroundColor red
  91.             #write-host "mtime id = $database_path\$x.txt "
  92.             #exit
  93.            #}
  94.            $tmpContent11 = Get-Content $database_path\$x.txt
  95.            if($tmpContent11.length -lt 5) {
  96.              $retry_cnt +=1
  97.              write-host "Retrying.... mtime_id = $x"
  98.              cmd /c "choice /t 5 /d y /n  1>nul 2>nul"
  99.            }
  100.       }# do
  101.       while($tmpContent11.length -lt 5 -and $retry_cnt -lt $retry_times) # 虽然有内容,但是内容不完整或者为空,需要重新访问该网页!
  102.       
  103.     }
  104.   }# if $web_request_enable
  105.   ###########################
  106.   #### 获取要解析的txt文件
  107.   ###########################
  108.   # $fileList = Get-ChildItem -Path $database_path -Filter $filter_txt -Recurse |sort | ?{$_.PsIsContainer -eq $false}| %{$_.FullName}
  109.   for ($x=$start_id_txt; $x -lt $end_id_txt; $x++)
  110.   {
  111.       if((Test-Path $database_path\$x.txt))   {
  112.         $singlefile = Get-ChildItem -Path $database_path -Filter "$x.txt"   | ?{$_.PsIsContainer -eq $false}| %{$_.FullName}
  113.         write-host "Add file -> $database_path\$x.txt"
  114.         $fileList.Add($singlefile)
  115.       }
  116.   }
  117.   ##############################################
  118.   #### Main Process :
  119.   ##############################################
  120.   $error_page_404=0 # 很抱歉,你要访问的页面不存在
  121.   $movie_db_txt=""                         #写入txt文件
  122.   $movie_name="<title>(.*?)</title>"       #电影名称
  123.   $movie_name_regexp="(.*?)([a-z|A-Z].*)"  #电影名称正则匹配, 匹配的是英文,如果 是韩语或者日文,就不进行 rename
  124.   $movie_name_regexp_match=0               #电影名称正则匹配 match, 结合上面的变量一起使用
  125.   $movie_name_rename_not=""                #电影名称rename
  126.   $movie_name_rename=""                    #电影名称rename
  127.   $movie_name_v_genre=":genre"              #电影类型: 剧情,喜剧,恐怖,惊悚等
  128.   $movie_name_v_genre_regexp=".*genre.*"   #电影类型: 剧情,喜剧,恐怖,惊悚等
  129.   
  130.   $movie_names_more="更多片名"                 #电影更多片名
  131.   $movie_names_more_each="<span>(.*?)</span>"  #电影更多片名正则匹配,例如:<span>圣诞快递 3D</span>
  132.   $movie_names_more_flag=0                     #电影更多片名 begin flag
  133.   $movie_names_more_flag_end=0                 #电影更多片名   end flag
  134.   
  135.   $movie_names_nation="国家地区"                 #电影国家地区
  136.   $movie_names_nation_each="_blank.*?>(.*?)</a>" #电影国家地区正则匹配,例如:<a href="http://movie.mtime.com/movie/search/section/?nation=Australia" target="_blank">澳大利亚</a>
  137.   $movie_names_nation_flag=0                     #电影国家地区 begin flag
  138.   $movie_names_nation_flag_end=0                 #电影国家地区   end flag
  139.   $spaces_6="           "
  140.   #write-host $filelist
  141.   
  142.   #****************************************************
  143.   #**  获取电影名称 国别 类型 更多片名 等信息
  144.   #****************************************************
  145.   Foreach($file in $fileList)
  146.   {
  147.       #write-host "file_name=" $file
  148.   
  149.     $tmpContent = Get-Content $file
  150.       $error_page_404=0
  151.       $movie_total_name = ""
  152.       $movie_total_genre=""
  153.       $movie_total_nation=""
  154.       $movie_name_regexp_match=0
  155.       $movie_names_more_flag=0                       #电影更多片名 begin flag
  156.       $movie_names_more_flag_end=0                   #电影更多片名   end flag
  157.       $movie_names_nation_flag=0                     #电影国家地区 begin flag
  158.       $movie_names_nation_flag_end=0                 #电影国家地区   end flag
  159.       $file_id=0
  160.       $file_id_already_exist=0
  161.       $file_id_already_exist_error=0
  162.       $file_id_already_exist_404=0
  163.       if($file -match ".*\\(\d+).txt") {$file_id=$matches[1]} # 获取 id
  164.       write-host "################################################################# "  -ForegroundColor black  -background red
  165.       Write-Host "Analyzing : $file ,id = $file_id"
  166.       #判断该id是否已经写入 database.csv ,避免重复解析文件
  167.       $tmpID = Get-Content $all_database_movie
  168.       for ($iii=0; $iii -le $tmpID.length; $iii++){
  169.         if($tmpID[$iii] -match "$file_id.*?;") {
  170.            $file_id_already_exist = 1
  171.         }#else { }
  172.       }
  173.       if($file_id_already_exist -eq 1) {
  174.          Write-Host "Analyzing : $file ,id = $file_id already exist in $all_database_movie, will continue next id file."
  175.          continue
  176.       }
  177.       if($tmpContent.length -lt 5){
  178.          write-host "################################################################# "  -ForegroundColor red
  179.          write-host "#############  内容不完整或者为空,需要重新访问该网页   ######### "  -ForegroundColor red
  180.          write-host "############# mtime id = $file                          ######### "  -ForegroundColor red
  181.          write-host "################################################################# "  -ForegroundColor red
  182.          $tmpIDerror = Get-Content $all_database_movie_page_error
  183.          for ($ii=0; $ii -le $tmpIDerror.length; $ii++){
  184.            if($tmpIDerror[$ii] -match "$file_id") {
  185.               $file_id_already_exist_error = 1
  186.            }#else { }
  187.          }
  188.          if( $file_id_already_exist_error -eq 0) {
  189.             "$file_id" | Out-File -Append $all_database_movie_page_error
  190.              break
  191.          }
  192.       }
  193.     for ($i=0; $i -le $tmpContent.length; $i++)
  194.     {
  195.         #****************************************************
  196.         #** (0) 对不起, 你要访问的页面不存在
  197.         #****************************************************
  198.         if($tmpContent[$i] -match "TIMEOUT") { #貌似不能匹配中文,
  199.            $error_page_404=1
  200.            write-host "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ "  -ForegroundColor yellow
  201.            write-host "@@@@@@@@@@@@@@  对不起, 你要访问的页面不存在          @@@@@@@@@@ "  -ForegroundColor yellow
  202.            write-host "@@@@@@@@@@@@@@  mtime id = $file                       @@@@@@@@@@ "  -ForegroundColor red
  203.            write-host "@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@ "  -ForegroundColor yellow
  204.            $tmpID404 = Get-Content $all_database_movie_page_404
  205.            for ($k=0; $k -le $tmpID404.length; $k++){
  206.              if($tmpID404[$k] -match "$file_id") {
  207.                 $file_id_already_exist_404 = 1
  208.              }#else { }
  209.            }
  210.            if( $file_id_already_exist_404 -eq 0) {
  211.               "$file_id" | Out-File -Append $all_database_movie_page_404
  212.                break
  213.              }
  214.         }
  215. if($error_page_404 -eq 0){
  216.              #****************************************************
  217.              #** (0) 获取电影类型 : 剧情 科幻等
  218.              #****************************************************
  219.           if($tmpContent[$i] -match $movie_name_v_genre_regexp) 
  220.           {
  221.            #write-host ""
  222.            write-host $spaces_6 $file : " $i " :
  223.            #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  224.                 write-host $spaces_6 "---------------------------------------"
  225.                 #write-host "movie_name_v_genre_regexp        ="$matches[0]
  226.                 $tmp=$matches[0]
  227.         $tmp1 = $tmp -replace $movie_name_v_genre,"`n"
  228.                 $tmp2 = $tmp1.split("`n")
  229.                 #write-host "tmp1        ="$tmp1
  230.                 #$tmp1 | Out-File tmpt
  231.                 #$tmptContent = Get-Content tmpt
  232.                 for ($j=0; $j -le $tmp2.length; $j++) {
  233.                  if($tmp2[$j] -match ".*?>(.*?)</a"){
  234.                    #write-host $matches[0]
  235.                    #write-host "movie_name_v_genre ="$matches[1]
  236.                    $movie_total_genre += $matches[1] + $str_connection
  237.                  }
  238.                 }
  239.                 write-host $spaces_6 "---------------------------------------"
  240.                 $found = 1;
  241.           }
  242.             
  243.              # #****************************************************
  244.              # #** (1) 获取电影名称
  245.              # #****************************************************
  246.             
  247.           if($tmpContent[$i] -match $movie_name) 
  248.           {
  249.             
  250.             
  251.              #有一些电影名字里有这种特殊字符,处理掉!
  252.               $name_tmp=$tmpContent[$i] -replace '&quot;',""
  253.                  $name_tmp_0=$name_tmp     -replace '·'," "
  254.                  $name_tmp_1=$name_tmp_0   -replace '#183;'," "
  255.                  $name_tmp_2=$name_tmp_1   -replace '&frac12;'," "
  256.                  $name_tmp_3=$name_tmp_2   -replace 'ü'," "
  257.                  $name_tmp_4=$name_tmp_3   -replace '&amp;#228;',"&auml;"
  258.               if($name_tmp_4 -match  $movie_name) {
  259.              #write-host ""
  260.              write-host $spaces_6 $file : " $i " :
  261.              #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  262.                  write-host $spaces_6 "---------------------------------------"
  263.                  write-host $spaces_6 $matches[0]、
  264.          $movie_name_rename_not = $matches[1]
  265.                  write-host $spaces_6 "movie_name        ="$movie_name_rename_not
  266.                  $tmp=$matches[1]
  267.                  if($tmp -match $movie_name_regexp){
  268.                    #write-host $matches[0]
  269.                    #write-host "movie_name_rename ="$matches[1]
  270.                    #write-host "movie_name_rename ="$matches[2]
  271.                    $movie_name_rename=$matches[2]+$matches[1]
  272.                    write-host $spaces_6 "movie_name_rename ="$movie_name_rename
  273.                    $movie_name_regexp_match = 1
  274.                  }
  275.                  write-host $spaces_6 "---------------------------------------"
  276.                  $found = 1;
  277.               }
  278.           }
  279.             
  280.              #****************************************************
  281.              #** (2) 获取国家地区
  282.              #****************************************************
  283.             
  284.              if($movie_names_nation_flag -eq 1) {
  285.                if($tmpContent[$i] -match "</dd>") 
  286.              {
  287.                     $movie_names_nation_flag_end=1
  288.          $movie_names_nation_flag = 0
  289.              }
  290.              }
  291.              #if($movie_names_nation_flag_end -eq 1) {continue}
  292.              if($movie_names_nation_flag -eq 0) {
  293.             if($tmpContent[$i] -match $movie_names_nation) 
  294.              {
  295.               #write-host ""
  296.                     $movie_names_nation_flag=1
  297.               write-host $spaces_6 $file : " $i " :
  298.               #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  299.                     write-host $spaces_6 "---------------------------------------"
  300.                     write-host $spaces_6 $matches[0]
  301.                     write-host $spaces_6 "movie_names_nation ="$matches[1]
  302.                     write-host $spaces_6 "---------------------------------------"
  303.                     $found = 1;
  304.              }
  305.               } elseif($movie_names_nation_flag -eq 1 -and $movie_names_nation_flag_end -eq 0) { # processing ...
  306.                 if($tmpContent[$i] -match $movie_names_nation_each) 
  307.              {
  308.               #write-host ""
  309.                     $movie_names_nation_flag=1
  310.               write-host $spaces_6 $file : " $i " :
  311.               #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  312.                     write-host $spaces_6 "----------------------------------------"  -ForegroundColor yellow #-background black
  313.                     write-host $spaces_6 $matches[0]
  314.                     write-host $spaces_6 "movie_names_nation_each ="$matches[1]      -ForegroundColor yellow #-background black
  315.                     $movie_total_nation += $matches[1] + $str_connection
  316.                     write-host $spaces_6 "---------------------------------------"   -ForegroundColor yellow #-background black
  317.                     $found = 1;
  318.              }
  319.               } elseif($movie_names_nation_flag -eq 1 -and $movie_names_nation_flag_end -eq 1) { # end processing...
  320.       }
  321.             
  322.             
  323.              #****************************************************
  324.              #** (3) 获取电影别名, 更多片名,更多译名
  325.              #****************************************************
  326.             
  327.              if($movie_names_more_flag -eq 1) {
  328.                if($tmpContent[$i] -match "</dd>") 
  329.              {
  330.                     $movie_names_more_flag_end=1
  331.          $movie_names_more_flag=0
  332.              }
  333.              }
  334.              if($movie_names_more_flag_end -eq 1) {continue}
  335.              if($movie_names_more_flag -eq 0) {
  336.             if($tmpContent[$i] -match $movie_names_more) 
  337.              {
  338.               #write-host ""
  339.                     $movie_names_more_flag=1
  340.               write-host $spaces_6 $file : " $i " :
  341.               #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  342.                     write-host $spaces_6 "---------------------------------------"
  343.                     write-host $spaces_6 $matches[0]
  344.                     write-host $spaces_6 "movie_names_more ="$matches[1]
  345.                     write-host $spaces_6 "---------------------------------------"
  346.                     $found = 1;
  347.              }
  348.               } else {
  349.                  if($tmpContent[$i] -match $movie_names_more_each) 
  350.              {
  351.                #write-host ""
  352.                     $name_each_tmp=$tmpContent[$i]    -replace '·'," "
  353.                     $name_each_tmp_0=$name_each_tmp   -replace '&amp;'," "
  354.                     $name_each_tmp_1=$name_each_tmp_0 -replace '#183;'," "
  355.                     $name_each_tmp_2=$name_each_tmp_1 -replace '&frac12;'," "
  356.                     $name_each_tmp_3=$name_each_tmp_2 -replace 'ü'," "
  357.                     $name_each_tmp_4=$name_each_tmp_3 -replace '&amp;#228;',"&auml;"
  358.                     
  359.                     $movie_names_more_flag=1
  360.                write-host $spaces_6 $file : " $i " :
  361.                   if($name_each_tmp_4 -match $movie_names_more_each){
  362.                #write-host $file " : " $i " : " $tmpContent[$i] -ForegroundColor yellow -background black
  363.                     write-host $spaces_6 "---------------------------------------"  -ForegroundColor yellow #-background black
  364.                     write-host $spaces_6 $matches[0]
  365.                     write-host $spaces_6 "movie_names_more_each ="$matches[1]       -ForegroundColor yellow #-background black
  366.                     $movie_total_name += $matches[1] + $str_connection
  367.                     write-host $spaces_6 "---------------------------------------"  -ForegroundColor yellow #-background black
  368.                     $found = 1;
  369.                    }
  370.              }
  371.              }
  372. } # error_page_404
  373.         ##########################################################
  374.         ##########################################################
  375.         ##########################################################
  376.     } #for
  377.       if($error_page_404 -eq 0){
  378.          $movie_db_txt=""  #write results to txt file
  379.          write-host "&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&"  -ForegroundColor green
  380.          write-host "&&&&& movie_id           ="$file                                           -ForegroundColor green
  381.          $movie_db_txt  = $movie_db_txt  +  $file_id + $str_connection_spaces
  382.          if($movie_name_regexp_match -eq 0) {
  383.             write-host "&&&&& movie_name_rename_not ="$movie_name_rename_not                    -ForegroundColor green
  384.             $movie_db_txt += $movie_name_rename_not + $str_connection_spaces
  385.          }else{
  386.             write-host "&&&&& movie_name_rename  ="$movie_name_rename                           -ForegroundColor green
  387.             $movie_db_txt += $movie_name_rename  + $str_connection_spaces
  388.          }
  389.          write-host "&&&&& movie_total_name   ="$movie_total_name                               -ForegroundColor green
  390.          write-host "&&&&& movie_total_genre  ="$movie_total_genre                              -ForegroundColor green
  391.          write-host "&&&&& movie_total_nation ="$movie_total_nation                             -ForegroundColor green
  392.          $movie_db_txt = $movie_db_txt + $movie_total_name  +  $str_connection_spaces
  393.          $movie_db_txt = $movie_db_txt + $movie_total_genre  + $str_connection_spaces
  394.          $movie_db_txt = $movie_db_txt + $movie_total_nation + $str_connection_spaces
  395.          $movie_db_txt |Out-File -append $all_database_movie
  396.          write-host "&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&"  -ForegroundColor green
  397.     }
  398.   }#foreach each_movie.txt
  399.   
  400.    write-host "------------------  script end!  --------------"
  401.   if ($found -eq 0)
  402.   {
  403.       write-host "没有找到您查找的字符串,请重新输入吧,O(∩_∩)O~ "  -ForegroundColor red -background black
  404.   }
  405. # for ($x=0; $x -lt $ar.Count; $x++)  {   write-host "ar["$x"]" = $ar[$x] }
  406.   
  407.   
  408.   
  409.   cmd /c "pause"
  410.   # Start-Sleep -s 10
复制代码

作者: 523066680    时间: 2018-2-1 15:27

本帖最后由 523066680 于 2018-2-1 15:33 编辑

bt天堂的资料挺齐全,抓过封面和磁力。主目录按评分,次级目录按类型


现在看看豆瓣影评的分类和评分索引也都做的很好,抓起来好分类。
作者: gflrlm    时间: 2018-2-8 22:37

回复 2# 523066680

版主大佬,能分享一下吗? 谢谢了,再写一遍浪费时间了,哈哈,偷个懒。。。
作者: 523066680    时间: 2018-2-8 22:57

回复 3# gflrlm


    已经回老家,节后分享




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2