标题:
[文本处理]
批处理如何提取特定数字和汉字?跪求大神
[打印本页]
作者:
寒门小侠
时间:
2017-9-6 01:34
标题:
批处理如何提取特定数字和汉字?跪求大神
825
10000001
止血药
false
t
10000002
粗制小黄丹
2
药品
ICON_I_Hp_02
10000003
精制小黄丹
以上,这是某个文本的内容,我要提取里面的8位数字这一行,和这8位数字下面一行,并在数字后面添加 ; 号。
要求的结果如下
10000001;止血药
10000002;粗制小黄丹
10000003;精制小黄丹
这是原始样本
这是结果文件
谢谢各位大神。。
作者:
hlzj88
时间:
2017-9-6 06:27
最好能放一两个原始样品上来,如太大,可提供部分。
作者:
codegay
时间:
2017-9-6 06:59
本帖最后由 codegay 于 2017-9-6 07:15 编辑
python的regex 正则增强模块支持用
\p{han}
匹配汉字,非常直观。
提取的正则大约是这样写 \d{8}\n\p{han}+
作者:
我来了
时间:
2017-9-6 08:37
[^x00-xff] 匹配汉字
作者:
codegay
时间:
2017-9-7 08:45
还以为是什么正经的东西。原来是私服游戏的配置文件。
欢迎光临 批处理之家 (http://www.bathome.net/)
Powered by Discuz! 7.2