Board logo

标题: [技术讨论] [分享]Powershell提取html网页标题,过滤后重命名html文件名 [打印本页]

作者: wxyz0001    时间: 2021-4-26 15:52     标题: [分享]Powershell提取html网页标题,过滤后重命名html文件名

本帖最后由 wxyz0001 于 2021-4-26 17:33 编辑

▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名:
573.html
688.html
741.html

html源文件里的标题<title>行:
<title>两幅油画的故事 - 读者文摘杂志(dzwzzz.com)</title>
<title>马克·扎克伯格的“脸谱” - 读者文摘杂志(dzwzzz.com)</title>
<title>戏比天大情比海深 - 读者文摘杂志(dzwzzz.com)</title>
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
代码如下:
  1. $thePath="E:\news"  #获取目录路径
  2. Get-ChildItem -Path $thePath -Filter "*.html"|ForEach-Object{
  3. $extension=$_.Extension #取扩展名
  4. $fileName=((get-content $_.FullName)|Select-String -Pattern "<title>" -Encoding default).Line -Replace([Regex]::Escape("<title>")),"" -Replace([Regex]::Escape(" - 读者文摘杂志(dzwzzz.com)</title>")),"" #取文件名-过滤
  5. $newName='{0}{1}' -f $fileName,$extension #过滤后的文件名+扩展名-格式化
  6. Rename-Item -Path $_.FullName -NewName $newName} #重命名文件名
复制代码
▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃
原文件名                  重命名后的html文件名:
----------------------------------------------------------
573.html                 两幅油画的故事.html
688.html                 马克·扎克伯格的“脸谱”.html
741.html                 戏比天大情比海深.html
作者: wxyz0001    时间: 2021-4-26 16:04

bat批量重命名html文件名的代码:
http://www.bathome.net/thread-54266-1-1.html




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2