[技术讨论] Python脚本删除文件中的重复行

本帖最后由 Python 于 2012-4-3 19:59 编辑

删除文件中的重复行：

rFile = open('a.txt', 'r')
wFile = open('b.txt', 'w')
allLine = rFile.readlines()
rFile.close()
s = set()
for i in allLine:
    s.add(i)
for i in s:
    wFile.write(i)
复制代码

open('b.txt', 'w').write(''.join(set(open('a.txt').readlines())))
复制代码

删除文件中的重复行并保持原来的顺序：

rFile = open("a.txt", "r")
wFile = open("b.txt", "w")
allLine = rFile.readlines()
rFile.close()
h = {}
for i in allLine:
    if not h.has_key(i):
        h[i]=1
        wFile.write(i)
wFile.close()
复制代码

lines, sorted = open('a.txt', 'r').readlines(), lambda a, cmp: a.sort(cmp=cmp) or a
open('b.txt', 'w').write(''.join([i[0] for i in sorted([(j, lines.index(j)) for j in set(lines)], lambda a,b: a[1]-b[1] )]))
复制代码

h,r,w ={}, file('a.txt'), file('b.txt','w')
w.write(reduce(lambda x,y:x+y, [i for i in r if h.get(i)==None and h.setdefault(i, True)]))
复制代码

s = []
[ s.append(k) for k in open('a.txt') if k not in s ]
open('b.txt', 'w').write(''.join(s))
复制代码

看看各位大湿还有没有其它方法

ivor

上校

Rank: 6 Rank: 6

帖子: 979
积分: 3381
技术: 172
捐助: 40
注册时间: 2012-1-7

2楼

发表于 2012-4-3 16:32 | 只看该作者

本帖最后由 ivor 于 2012-4-3 17:02 编辑

办法都让你写出来了

第一个例子，python3.2版本运行需更改为

rFile.close()
复制代码

TOP

Python

少校

Rank: 6 Rank: 6

帖子: 225
积分: 2218
技术: 23
捐助: 0
注册时间: 2012-2-17

3楼

发表于 2012-4-3 20:00 | 只看该作者

回复 2# ivor

嗯，更新了一下顶楼的代码，省的后面再有人提这茬

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[技术讨论] Python脚本删除文件中的重复行

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]