返回列表发帖

qianshang

列兵

Rank: 1

帖子: 11
积分: 25
技术: 0
捐助: 0
注册时间: 2020-9-10

1楼 跳转到 » 正序看帖

打印

字体大小: tT

发表于 2020-11-30 23:07 | 只看该作者

[已解决]35求助读取XML文件指定信息

解析每个ID的信息 <ID></ID> 其中的UserType, UserVendorId, UserSubType, Flags以及注释信息保存成txt 用python写最好
<?xml version="1.0" encoding="UTF-8" standalone="no"?>

qianshang

列兵

Rank: 1

帖子: 11
积分: 25
技术: 0
捐助: 0
注册时间: 2020-9-10

5楼

发表于 2020-12-1 00:52 | 只看该作者

OK 已转账

TOP

zaqmlp

上尉

Rank: 5 Rank: 5

帖子: 974
积分: 1275
技术: 94
捐助: 0
注册时间: 2017-10-30

4楼

发表于 2020-12-1 00:28 | 只看该作者

回复 3# qianshang
19行，自行选择修改
有数字

m=re.findall(r'<ID\d+>[\s\S]+?<\/ID\d+>',text)COPY

无数字

m=re.findall(r'<ID>[\s\S]+?<\/ID>',text)COPY

提供bat代写，为你省时省力省事，支付宝扫码头像支付
微信: unique2random

TOP

qianshang

列兵

Rank: 1

帖子: 11
积分: 25
技术: 0
捐助: 0
注册时间: 2020-9-10

3楼

发表于 2020-12-1 00:01 | 只看该作者

感谢大佬还有个问题就是这里面<ID1>....<ID5> 跟后面<ID>...</ID>数据其实是重复的这个可以只取一次么

TOP

zaqmlp

上尉

Rank: 5 Rank: 5

帖子: 974
积分: 1275
技术: 94
捐助: 0
注册时间: 2017-10-30

2楼

发表于 2020-11-30 23:48 | 只看该作者

 # encoding: utf-8
# Python 3.6.0
 
import os
import codecs
import re
 
path='.'
arr=os.listdir(path)
for it in arr:
    file=os.path.join(path, it)
    if os.path.isfile(file) and (it[-4:].lower()=='.xml'):
        print(file)
        f=codecs.open(file,'r','utf-8')
        text=f.read()
        f.close()
        txtfile=file+'.txt'
        f=codecs.open(txtfile,'w','gb2312')
        m=re.findall(r'<ID\d*>[\s\S]+?<\/ID\d*>',text)
        for it in m:
            brr=['','','','','']
            a=re.search(r'[^>]+(?=<\/UserType>)',it)
            if a:
                brr[0]=a.group(0)
            b=re.search(r'[^>]+(?=<\/UserVendorId>)',it)
            if b:
                brr[1]=b.group(0)
            c=re.search(r'[^>]+(?=<\/UserSubType>)',it)
            if c:
                brr[2]=c.group(0)
            d=re.search(r'[^>]+(?=<\/Flags>)',it)
            if d:
                brr[3]=d.group(0)
            e=re.search(r'(?<=<!--)[^>]+(?=-->)',it)
            if e:
                brr[4]=e.group(0)
            line='\t'.join(brr)
            f.write(line+'\r\n')
        f.close()COPY

提供bat代写，为你省时省力省事，支付宝扫码头像支付
微信: unique2random

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[已解决]35求助读取XML文件指定信息

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

设置关闭

开启【页面动态效果 + 卡片式布局】
关闭【页面动态效果 + 卡片式布局】

开启【代码高亮】
关闭【代码高亮】

代码高亮主题【亮】
代码高亮主题【暗】


	设置关闭开启【页面动态效果 + 卡片式布局】关闭【页面动态效果 + 卡片式布局】开启【代码高亮】关闭【代码高亮】代码高亮主题【亮】代码高亮主题【暗】

[已解决]35求助 读取XML文件指定信息

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

设置 关闭

开启 【页面动态效果 + 卡片式布局】 关闭 【页面动态效果 + 卡片式布局】 开启 【代码高亮】关闭 【代码高亮】代码高亮主题 【亮】代码高亮主题 【暗】

[已解决]35求助读取XML文件指定信息

设置关闭

开启【页面动态效果 + 卡片式布局】
关闭【页面动态效果 + 卡片式布局】

开启【代码高亮】
关闭【代码高亮】

代码高亮主题【亮】
代码高亮主题【暗】