标题: [问题求助] PowerShell提取命令帮助文件中的示例 [打印本页]
作者: 5i365 时间: 2022-4-23 12:45 标题: PowerShell提取命令帮助文件中的示例
我想将某个命令帮助文件中的示例提取出来, 期待高手能支招, 提前感谢!
最下面的代码, 只提取出了示例的标题, 标题下有几行是示例, 很有规律, 正则提取: 标题行下有一个空行, 然后就是1行或多行连续的示例, 接着有一个空行
例如 get-Content 这个命令帮助的示例, 我节选了一些, 其中的蓝字部分就是示例
------------------ Example 6: Get raw content ------------------
$raw = Get-Content -Path .\LineNumbers.txt -Raw
$lines = Get-Content -Path .\LineNumbers.txt
Write-Host "Raw contains $($raw.Count) lines."
Write-Host "Lines contains $($lines.Count) lines."
Raw contains 1 lines.
Lines contains 100 lines.
----------- Example 7: Use Filters with Get-Content -----------
Get-Content -Path C:\Temp\* -Filter *.log
--------- Example 8: Get file contents as a byte array ---------
$byteArray = Get-Content -Path C:\temp\test.txt -Encoding Byte -Raw
Get-Member -InputObject $bytearray
TypeName: System.Byte[]
Name MemberType Definition
---- ---------- ----------
Count AliasProperty Count = Length
Add Method int IList.Add(System.Object value)
----------------------------------------------------------------------------------------------------------------------------
期待提取后的结果:
------------------ Example 6: Get raw content ------------------
$raw = Get-Content -Path .\LineNumbers.txt -Raw
$lines = Get-Content -Path .\LineNumbers.txt
Write-Host "Raw contains $($raw.Count) lines."
Write-Host "Lines contains $($lines.Count) lines."
----------- Example 7: Use Filters with Get-Content -----------
Get-Content -Path C:\Temp\* -Filter *.log
--------- Example 8: Get file contents as a byte array ---------
$byteArray = Get-Content -Path C:\temp\test.txt -Encoding Byte -Raw
Get-Member -InputObject $bytearray
----------------------------------------------------------------------------------------------------------------------------- $c = "get-Content"
- ((get-help $c -Examples | Out-String) -split '\n') | foreach { $_.trim() } | sls ".+Example\s\d:.+"
复制代码
作者: idwma 时间: 2022-4-23 14:57
- $c = "get-Content"
- ((get-help $c -Examples | Out-String) -split '\n') | foreach { $_.trim() } | sls ".+Example\s\d:.+|$c|\$"
复制代码
作者: 5i365 时间: 2022-4-23 16:23
回复 2# idwma
感谢大侠支招, 匹配还是有点问题, 结果如下:
Get-Content
---------- Example 1: Get the content of a text file ----------
1..100 | ForEach-Object { Add-Content -Path .\LineNumbers.txt -Value "This is line $_." }
Get-Content -Path .\LineNumbers.txt
ate the `LineNumbers.txt` file. The variable `$_` represents the array values as each object is sent down the pipeline. The `Get-Content` cmdlet uses the P
--- Example 2: Limit the number of lines Get-Content returns ---
Get-Content -Path .\LineNumbers.txt -TotalCount 5
-- Example 3: Get a specific line of content from a text file --
(Get-Content -Path .\LineNumbers.txt -TotalCount 25)[-1]
The `Get-Content` command is wrapped in parentheses so that the command completes before going to the next step. `Get-Content`returns an array of lines, th
--------- Example 4: Get the last line of a text file ---------
Get-Item -Path .\LineNumbers.txt | Get-Content -Tail 1
This example uses the `Get-Item` cmdlet to demonstrate that you can pipe files into the `Get-Content` parameter. The Tail parameter gets the last line of t
---- Example 5: Get the content of an alternate data stream ----
PSPath : Microsoft.PowerShell.Core\FileSystem::C:\Test\Stream.txt:DATA
PSChildName : Stream.txt::$DATA
Stream : :$DATA
# Retrieve the content of the primary, or $DATA stream.
Get-Content -Path .\Stream.txt -Stream $DATA
PSPath : Microsoft.PowerShell.Core\FileSystem::C:\Test\Stream.txt::$DATA
PSChildName : Stream.txt::$DATA
Stream : :$DATA
Get-Content -Path .\Stream.txt -Stream NewStream
). By default `Get-Content` only retrieves data from the primary, or `$DATA` stream. Streams can be used to store hidden data such as attributes, security
------------------ Example 6: Get raw content ------------------
$raw = Get-Content -Path .\LineNumbers.txt -Raw
$lines = Get-Content -Path .\LineNumbers.txt
Write-Host "Raw contains $($raw.Count) lines."
Write-Host "Lines contains $($lines.Count) lines."
----------- Example 7: Use Filters with Get-Content -----------
Get-Content -Path C:\Temp\* -Filter *.log
--------- Example 8: Get file contents as a byte array ---------
$byteArray = Get-Content -Path C:\temp\test.txt -Encoding Byte -Raw
Get-Member -InputObject $bytearray
作者: idwma 时间: 2022-4-23 18:23
- $c = "get-Content"
- (get-help $c -Examples | Out-String) -replace '[\s\S]*?(.+Example\s\d:.+\n\s*\n[\s\S]*?\n\s*\n)[\s\S]*?\n\s*\n\s*\n','$1'
复制代码
作者: 5i365 时间: 2022-4-23 18:29
回复 4# idwma
有几个示例丢了
---------- Example 1: Get the content of a text file ----------
1..100 | ForEach-Object { Add-Content -Path .\LineNumbers.txt -Value "This is line $_." }
Get-Content -Path .\LineNumbers.txt
-- Example 3: Get a specific line of content from a text file --
(Get-Content -Path .\LineNumbers.txt -TotalCount 25)[-1]
----------- Example 7: Use Filters with Get-Content -----------
Get-Content -Path C:\Temp\* -Filter *.log
作者: idwma 时间: 2022-4-23 18:34
ps版本不一样输出的格式不一样,发个完整的help gc输出来看看
作者: 5i365 时间: 2022-4-23 18:37
回复 6# idwma
哦, 我的是WIN7下的帮助
https://send.cm/d/AM0K
作者: idwma 时间: 2022-4-23 19:07
- $c = "get-Content"
- [regex]::matches($(get-help $c -Examples | Out-String),'(.+Example\s\d:.+\n\s*\n[\s\S]*?)\n\s*\n')|%{$_.groups[1].value}
复制代码
作者: 5i365 时间: 2022-4-23 19:12
回复 8# idwma
感谢大侠帮忙,
看来正则配合分组还是很有用, 很常见的, 多个示例, 都用到了group
作者: 5i365 时间: 2022-4-23 19:15
回复 8# idwma
大侠, 总感觉, 用 select-string 能更好的解决问题, 因为它后面可以加, 多个模式匹配的字符串
Select-String [-Pattern] <String[]>
作者: idwma 时间: 2022-4-23 22:08
回复 10# 5i365
用这个怎么判断多行?
作者: 5i365 时间: 2022-4-23 22:17
回复 11# idwma
它 有一个 上下文 参数, 选择匹配前扣的行, 可能用不上,
最主要是可以同时用多个正则参数, 配合一下, 好像无所不能似的, 我对正则, 迷迷糊糊的, 一配合就更晕了
这个选择字符串很强大, 看到好多国外的贴子, 截取段落什么的, 都用的它, 很少用match什么的
作者: idwma 时间: 2022-4-23 22:21
回复 12# 5i365
那些功能好像在ps2.0上用不了,不通用就不去研究了
作者: 5i365 时间: 2022-4-23 22:23
回复 13# idwma
好的, 到时候我看到国外的类似的例子, 把代码贴过来, 在讨论一下
作者: 5i365 时间: 2022-4-26 22:42
回复 13# idwma
大侠好, win7和win10帮助系统还真是不统一, 上面的匹配正则不能通用, 现在突然有个新的想法, 就是获取在线帮助的示例, 看了一下, 非常有规律 一个示例标题, 一段代码, 如下图所示,
我已经用下面的代码, 获取到网页的内容了, 但是不知道怎么取示例的值, 感觉这个非常有挑战性, 貌似爬虫就是这一类的爬法
查了些资料, 好像说是用xpath定位到html元素, 然后就取到值了, 感觉应该能实现
$r = Invoke-RestMethod (gcm sc).HelpUri
$r
作者: idwma 时间: 2022-4-26 23:01
回复 15# 5i365
不会
作者: went 时间: 2022-4-26 23:49
- cls
- $r = Invoke-WebRequest -Uri ((gcm sc).HelpUri)
- $r.ParsedHtml.getElementsByTagName('h3') | Where-Object { $_.id -match '^example' } | foreach {
- '------{0}------' -f $_.innerText
- $_.nextSibling.nextSibling.innerText
- }
复制代码
作者: 5i365 时间: 2022-4-27 06:53
本帖最后由 5i365 于 2022-4-27 07:02 编辑
回复 17# went
感谢大侠帮忙, 测试了一下, 最后取的示例错了
链接
http://go.microsoft.com/fwlink/?LinkID=113392
取到的结果:
------Example 4: Use Filters with Set-Content------
The following command set the content all *.txt files in the C:\Temp directory to the Value empty.
应该取:
Set-Content -Path C:\Temp\* -Filter *.txt -Value "Empty"
规律是:如果一行开头包含 powershell 结尾包含复制,它的下一行就是要取的内容
作者: went 时间: 2022-4-27 12:34
- cls
- $r = Invoke-WebRequest -Uri ((gcm sc).HelpUri)
- $r.ParsedHtml.getElementsByTagName('h3') | Where-Object { $_.id -match '^example' } | foreach {
- '------{0}------' -f $_.innerText
- $ele = $_
- while($ele.tagName -ne 'PRE'){ $ele = $ele.nextSibling }
- $ele.innerText
- }
复制代码
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |