标题: [问题求助] 求PowerShell同时匹配多种情况的正则 [打印本页]
作者: 小白龙 时间: 2023-3-10 20:08 标题: 求PowerShell同时匹配多种情况的正则
3$_yui 小红花
2wer_iop 大花轿 azc
8_iop 中国龙
我想把上面的红色字用一个正则匹配出来, 总是搞不全, 求高手支招, 谢谢
规律:
开头是一个数字, 其后可能空或者是$或者是wer, 接着是_ 然后是多个字符, 接着是一个空格 然后是红色字, 后面, 可能没有字符了, 还可能有一个空格, 空格后有字符
下面是我写的, 匹配不全
"\d[\$|wer]*_.+? (.+?) .+"
作者: Five66 时间: 2023-3-10 20:38
匹配不需要的,剩下的就是需要的复制代码
作者: 小白龙 时间: 2023-3-10 21:01
回复 2# Five66
多谢大佬
没看懂, 常规的正则式应该怎么写
作者: Five66 时间: 2023-3-10 21:28
复制代码
作者: Five66 时间: 2023-3-10 21:31
回复 4# Five66
用英文单引号引起来
作者: pd1 时间: 2023-3-10 21:35
匹配汉字?
[\u4e00-\u9fa5]+
作者: 小白龙 时间: 2023-3-10 22:06
回复 5# Five66
多谢, 我执行后为什么只能返回一个中文字?
$s='3$_yui 小红花'
$s -match '\d[$wer]*_\S+ (\S)+ ?.*'
$matches
True
Name Value
---- -----
1 花
0 3$_yui 小红花
作者: 小白龙 时间: 2023-3-10 22:07
回复 5# Five66
用我这个也不行
\d[\$wer]*?_.+? (.+?) ?.*
作者: 小白龙 时间: 2023-3-10 22:09
回复 6# pd1
不只汉字, 任意字符, 但很规律
作者: 小白龙 时间: 2023-3-10 22:11
本帖最后由 小白龙 于 2023-3-10 22:13 编辑
回复 4# Five66
不好意思, 忘了提一点,
规律中提到: 数字后有$或wer或无 就这三种固定情况, 不是任一字符
作者: 小白龙 时间: 2023-3-10 22:27
回复 5# Five66
用 \d[$wer]*_.+? (.+)? ?.*
输出了后面的 aaa 为什么? 但是括号里没有包含 aaa
PS C:\Users\Administrator>
$s='3$_yui 小花猫 aaa'
$s -match '\d[$wer]*_.+? (.+)? ?.*'
$matches
True
Name Value
---- -----
1 小花猫 aaa
0 3$_yui 小花猫 aaa
作者: 小白龙 时间: 2023-3-10 22:36
用上面的正则可以适应另两种情况, 就是有上面的问题, 总是把空格后的内容匹配进去, 怪了, 求路过大佬
作者: xczxczxcz 时间: 2023-3-10 22:47
不明白 .* .+ .*? .*? 的匹配过程就尽量不要用,估计大部分被网上垃圾文章忽悠成?为尽可能少匹配|匹配 0个或1个(包括微软的狗屎文档)。
?号的真实意图为 回溯的方向。(不传之密)
若明白了1个?的回溯次数。你就可以任意写正则了。- [regex]::Matches($t, "(?m)(?<=\d[^\s]*\s+)\b[^\s]*\b").value;
复制代码
作者: 小白龙 时间: 2023-3-10 23:30
回复 13# xczxczxcz
多谢大佬,
我把前在的(?m)删除掉, 无论是处理单行还是多行文本, 仍然有效
作者: 小白龙 时间: 2023-3-10 23:37
回复 13# xczxczxcz
大佬 有推荐的文章吗? 您说的太高深了, 我搞混了, 不明白什么叫回溯, 上面的正则, 似懂非懂
作者: Five66 时间: 2023-3-11 00:21
回复 7# 小白龙
啊,搞错了,括号捕获位置换下, (\S)+换成(\S+)- '\d[$wer]*_\S+ (\S+) ?.*'
复制代码
作者: 小白龙 时间: 2023-3-11 10:05
回复 16# Five66
这回可以了, 但是还是有问题
[$wer]
这是指包含任一里面的字符, 而我的情况是三种
一:
$
二:
wer
三:
无
上面正则, 会把4$wer_ 开头的也匹配了
应该是匹配下面三种情况
4$_
4wer_
4_
作者: idwma 时间: 2023-3-11 16:38
推荐一个在线测试工具,可以自动拆分讲解
https://regexr.com/
作者: 小白龙 时间: 2023-3-11 16:55
回复 18# idwma
多谢大佬,
全英文的, 不知道怎么用
作者: Five66 时间: 2023-3-11 17:10
回复 17# 小白龙
不是很懂你的匹配目的
[$wer]后面不是有个*号?
*号是匹配0次或多次
匹配0次不就相当于第三种情况的无
匹配1次相对于第一种情况$
匹配3次相当于第二种情况wer
非要严格分三种情况就用
(_|$|wer)
然后去掉原来后面的*_符号,不过这样多了个分组
作者: idwma 时间: 2023-3-11 18:00
回复 19# 小白龙
https://regexr-cn.com/
作者: WHY 时间: 2023-3-11 20:31
本帖最后由 WHY 于 2023-3-11 20:52 编辑
- $s = @'
- 3$_yui 小红花
- 2wer_iop 大花轿 azc
- 8_iop 中国龙
- '@
- [regex]::Matches($s, '(?im)(?<=^[0-9](?:\$|wer)?_\S+ )\S+').Value
- $s.Split("`r`n") -match '^[0-9](?:\$|wer)?_\S+\s\S+' | %{$_.Split()[1]}
复制代码
欢迎光临 批处理之家 (http://www.bathome.net/) |
Powered by Discuz! 7.2 |