Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

1楼 跳转到 » 倒序看帖

字体大小: tT

发表于 2016-10-15 20:36 | 显示全部帖子

[原创教程] python获取字母在字母表对应位置的几种方法及性能对比较

python获取字母在字母表对应位置的几种方法及性能对比较

某些情况下要求我们查出字母在字母表中的顺序，A = 1,B = 2 , C = 3，以此类推，比如这道题目 https://projecteuler.net/problem=42
其中一步解题步骤就是需要把字母换算成字母表中对应的顺序。

获取字母在字母表对应位置的方法，最容易想到的实现的是：

使用str.index 或者str.find方法：

 In [137]: "ABC".index('B')
Out[137]: 1
 
In [138]: "ABC".index('B')+1
Out[138]: 2
 
#或者在前面填充一个字符,这样index就直接得到字母序号：
In [139]: "_ABC".index("B")
Out[139]: 2COPY

我还想到把字母表转成list或者tuple再index，性能或者会有提高？
或者把字母:数字组成键值存到字典中是个好办法？

前两天我还自己顿悟到了一个方法：

 In [140]: ord('B')-64
Out[140]: 2COPY

ord 和chr 都是python中的内置函数,ord可以把ASCII字符转成对应在ASCII表中的序号,chr则是可以把序号转成字符串。

大写字母中在表中是从65开始，减掉64刚好是大写字母在表中的位置。
小写字母是从97开始，减于96就是对应的字母表位置。

哪种方法可能在性能上更好？我写了代码来测试一下：

 az = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
_az = "_ABCDEFGHIJKLMNOPQRSTUVWXYZ"
 
azlist = list(az)
 
azdict = dict(zip(az,range(1,27)))
 
text = az*1000000 #这个是测试数据
 
#str.find和str.index的是一样的。这里就没必要写了。
def azindexstr(text):
    for r in text:
        az.index(r)+1
        pass
 
def _azindexstr(text):
    for r in text:
        _az.index(r)
        pass
 
def azindexlist(text):
    for r in text:
        azlist.index(r)
        pass
 
def azindexdict(text):
    for r in text:
        azdict.get(r)
        pass
 
def azindexdict2(text):
    for r in text:
        azdict[r]
        pass
 
def azord(text):
    for r in text:
        ord(r)-64
        pass
 
def azand64(text):
    for r in text:
        ord(r)%64
        passCOPY

把上面的代码复制粘贴到ipython ，然后用魔法函数%timeit测试各个方法的性能。
ipython 是一个python交互解释器，附带各种很实用的功能，比如文本主要到的%timeit 功能。
请输入pip install ipython安装.

以下是我测试的结果数据：

 In [147]: %timeit azindexstr(text)
1 loop, best of 3: 9.09 s per loop
 
In [148]: %timeit _azindexstr(text)
1 loop, best of 3: 8.1 s per loop
 
In [149]: %timeit azindexlist(text)
1 loop, best of 3: 17.1 s per loop
 
In [150]: %timeit azindexdict(text)
1 loop, best of 3: 4.54 s per loop
 
In [151]: %timeit azindexdict2(text)
1 loop, best of 3: 1.99 s per loop
 
In [152]: %timeit azord(text)
1 loop, best of 3: 2.94 s per loop
 
In [153]: %timeit azand64(text)
1 loop, best of 3: 4.56 s per loopCOPY

从结果中可见到list.index速度最慢，我很意外。另外如果list中数据很多，index会慢得很严重。
dict[r]的速度比dict.get(r)的速度快，但是如果是一个不存在的键dict[r]会报错,而dict.get方法不会报错，容错性更好。

ord(r)-64的方法速度不错，使用起来应该也是最方便，不用构造数据。

2016年10月15日 20:31:19 codegay

扩展阅读:

ASCII对照表 http://tool.oschina.net/commons?type=4

IPython Tips and Tricks
http://blog.endpoint.com/2015/06/ipython-tips-and-tricks.html

1 评分人数

happy886rr: 不错，学习了技术 + 1

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

codegay

少校

Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

2楼

发表于 2016-10-15 22:12 | 显示全部帖子

回复 2# happy886rr

你这int的写法真奇怪。

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

codegay

少校

Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

3楼

发表于 2016-10-16 08:00 | 显示全部帖子

http://www.cnblogs.com/huangjacky/archive/2012/04/19/2457842.html

方法有好几个，效果也各不相同。

类型工厂函数,int()，效果：浮点数取整，如int(3.5)就返回3；数字的字符形式转换成数字，如int("35")就返回35
内置函数的round(),四舍五入，第二个参数是保留小数点后多少位，默认是0，如round(3.5)返回4.0，round(3.5,1)就返回3.5，不能取整。。。囧
math模块的floor(),取小于等于的整数,如floor(3.5)返回3.0,floor(-1.5)返回-2.0，也不能取整。。。再囧
与方法1对应的就是浮点数的类型工厂函数，float()，如float(3)返回3.0,float("3.5")返回3.5

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

codegay

少校

Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

4楼

发表于 2016-10-16 08:03 | 显示全部帖子

 >>> math.ceil(3.5)
4COPY

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

codegay

少校

Rank: 6 Rank: 6

帖子: 1266
积分: 1775
技术: 162
捐助: 0
注册时间: 2015-12-12

5楼

发表于 2016-10-16 08:18 | 显示全部帖子

发现//这个方法是个坑。碰上浮点数的时候不是返回整形

 >>> 3.5//1
3.0
>>> 3.5//1.0
3.0
>>> 3.5//10
0.0
>>> 3.5//2
1.0COPY

去学去写去用才有进步。安装python3代码存为xx.py 双击运行或右键用IDLE打开按F5运行

TOP

返回列表

[新手上路]批处理新手入门导读	[视频教程]批处理基础视频教程	[视频教程]VBS基础视频教程	[批处理精品]批处理版照片整理器
[批处理精品]纯批处理备份&还原驱动	[批处理精品]CMD命令50条不能说的秘密	[在线下载]第三方命令行工具	[在线帮助]VBScript / JScript 在线参考

[原创教程] python获取字母在字母表对应位置的几种方法及性能对比较

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

设置关闭

开启【页面动态效果 + 卡片式布局】
关闭【页面动态效果 + 卡片式布局】

开启【代码高亮】
关闭【代码高亮】

代码高亮主题【亮】
代码高亮主题【暗】


	设置关闭开启【页面动态效果 + 卡片式布局】关闭【页面动态效果 + 卡片式布局】开启【代码高亮】关闭【代码高亮】代码高亮主题【亮】代码高亮主题【暗】

[原创教程] python获取字母在字母表对应位置的几种方法及性能对比较

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]

设置 关闭

开启 【页面动态效果 + 卡片式布局】 关闭 【页面动态效果 + 卡片式布局】 开启 【代码高亮】关闭 【代码高亮】代码高亮主题 【亮】代码高亮主题 【暗】

设置关闭

开启【页面动态效果 + 卡片式布局】
关闭【页面动态效果 + 卡片式布局】

开启【代码高亮】
关闭【代码高亮】

代码高亮主题【亮】
代码高亮主题【暗】