Board logo

标题: [文本处理] [已经解决]bat 提取txt内符合拼音结构的行 [打印本页]

作者: w1983912    时间: 2015-3-31 20:30     标题: [已经解决]bat 提取txt内符合拼音结构的行

本帖最后由 w1983912 于 2015-4-2 11:09 编辑

TXT  一条一行  提取第一个标点符号前符合拼音结构的行  和网址那个域名有点类似

akms120;miyw
aaanyeti,m1e
miayean,ui
zhange123,e
zhanghaip,o9p


只有以下两个符合
aaanyeti,m1e
miayean,ui



拼音字典 pinyin.txt  一个一行
a
e
u
ai
an
ye
ti
mi
hao
heng
zhang
zhuang
等等 省略了很多  匹配起来可能要先匹配最大的那个再匹配后面的

如  zhanghaoduo     会先匹配 zhang  而不会先匹配 zhan 或zha

请各位大神帮帮忙 先谢谢了
作者: pcl_test    时间: 2015-3-31 20:50

本帖最后由 pcl_test 于 2015-4-1 15:53 编辑

回复 1# w1983912
  1. @echo off
  2. setlocal enabledelayedexpansion
  3. (for /f "tokens=1* delims=,;" %%a in ('type "测试.txt"') do (
  4. set "word=%%aж"
  5. for /f "delims=" %%b in ('type "pinyin.txt" ^|sort /+65535') do (
  6. set "word=!word:%%b=!"
  7. )
  8. if "!word!" == "ж" findstr /b /r "%%a" "测试.txt"
  9. ))>"结果.txt"
  10. pause
复制代码

作者: w1983912    时间: 2015-4-2 11:09

回复 2# pcl_test

技术不是一般般 谢谢




欢迎光临 批处理之家 (http://www.bathome.net/) Powered by Discuz! 7.2