返回列表 发帖
并没有说明输出格式。

我试试 python list排序。

TOP

#求txt文件中所有Z后面数字的最小值和最大值
#依山居 19:04 2015/11/7
#题目来源: http://www.bathome.net/thread-38027-1-1.html
zl=[]
with open("a.txt") as f:
        for l in f:
                txtline=l.rsplit()
                for ll in txtline:
                        #print(ll)
                        if ll[0]=="Z":
                                x=float(ll[1:])
                                zl.append(x)
                                
#方法一:使用python内建的max min函数
print("大: ",max(zl))
print("小: ",min(zl))
#方法二: 使用sorted排序后取首位和末尾元素。
zl=sorted(zl)
print("小: ",zl[0])
print("大: ",zl[-1])
#总结是不管是max 还是sort 比较的对象都应该统一是数字。
#所以处理前需要先丢掉字母Z并转成浮点数。
"""
输出:
大:  30.0
小:  -50.013
小:  -50.013
大:  30.0
"""COPY

TOP

楼主也是08年的帐号了。学门语言不过几周能入门了。

TOP

#python正则求txt文件中所有Z后面数字的最小值和最大值
#依山居 2:23 2015/11/8
#题目来源: http://www.bathome.net/thread-38027-1-1.html
#这个版本改用正则表达式处理文本.
import re
def ftxt(txt="a.txt"):
        #global zl
        zl=[]
        reg=re.compile("Z(-?\d*\.?\d*)")
        with open(txt) as f:
                for line in f:
                        regresult=re.findall(reg,line)
                        if regresult:
                                for r in regresult:                                       
                                       zl.append(float(r))
        print(len(zl))
        return zl
        
zl=ftxt()
print(zl)
#方法一:使用python内建的max min函数
print("大: ",max(zl))
print("小: ",min(zl))
#方法二: 使用sorted排序后取首位和末尾元素。
zl=sorted(zl)
print("小: ",zl[0])
print("大: ",zl[-1])
#总结是不管是max 还是sort 比较的对象都应该统一是数字。
#所以处理前需要先丢掉字母Z并转成浮点数。
"""
输出:
11
[19.429, -14.477, -14.77, -15.012, -15.312, -16.012,
-50.013, 30.0, -14.977, -15.012, -15.012]
大:  30.0
小:  -50.013
小:  -50.013
大:  30.0
"""COPY

TOP

回复 3# pcl_test


    请问版主,为什么正则我写成Z(-?\d*\.?\d+)
发现也能匹配到 30. 呢?小数点后面并没有数字啊?

TOP

#python生成测试数据
#依山居 10:07 2015/11/11
import random
import string
import time
start=time.time()
az=string.ascii_uppercase
out=open("b.txt","a+")
for r in range(10000000):
    ts=""
    for s in range(1,random.randint(1,10)):
            #razint=random.randint(0,25)
            #raz=az[razint] #-_- random.choice()方法,简单也是等效的。
            raz=random.choice(az)
            rf=random.uniform(-99,999)
            rf=round(rf,random.randint(0,4))
            ts+=raz+str(rf)+" "
    out.write(ts+"\n")
            
out.close()
end=time.time()
pt=end-start
print("程序运行时间:",pt)
try:
    input("按回车退出")
except SyntaxError:
    passCOPY
处理几十M的文本都说觉得大了。生成了一千万行→_→"大数据"测试,文本也不过400M而已。反正几百M的文件都小于可用内存。一次读入完全不成问题。

TOP

回复 9# pcl_test


    我也顺便给版主反馈一下。不需要逐行处理。
#python正则求txt文件中所有Z后面数字的最小值和最大值3
#依山居 10:57 2015/11/11
#题目来源: http://www.bathome.net/thread-38027-1-1.html
#这个版本使用read()直接读入整个文件内容然后正则匹配.
#经过测试比逐行处理,速度快了3-5倍
#总结:一次性读入正则匹配整个文件内容,处理速度快了3-5倍。
#要不是自己起心生成数据来测试,就被带到沟里了。
import time
start=time.time()
import re
def ftxt(txt="b.txt"):
        #global zl
        zl=[]
        reg=re.compile("Z(-?\d*\.?\d*)")
        with open(txt) as f:
                c=f.read()
                regresult=re.findall(reg,c)
                if regresult:
                        for r in regresult:
                                zl.append(float(r))                           
        return zl
        
zl=ftxt()
print("list长度: ",len(zl))
#方法一:使用python内建的max min函数
print("大: ",max(zl))
print("小: ",min(zl))
#方法二: 使用sorted排序后取首位和末尾元素。
#还可以用zl.sort(reverse=True) zl.reverse() 排序
zl=sorted(zl)
print("小: ",zl[0])
print("大: ",zl[-1])
#总结是不管是max 还是sort 比较的对象都应该统一是数字。
#所以处理前需要先丢掉字母Z并转成浮点数。
end=time.time()
pt=end-start
print("程序运行时间:",pt)
try:
    input("按回车退出")
except SyntaxError:
    pass
"""
输出:
list长度:  1921678
大:  999.0
小:  -99.0
小:  -99.0
大:  999.0
程序运行时间: 7.053403377532959
""COPY

TOP

回复 16# raozhao2008


    下载安装python3
代码存为xx.py

TOP

返回列表