分析Python字符串拼接+=和join()哪个速度更快
作者:程序猿过家家
这篇文章主要分析了Python中字符串拼接+=和join()哪个速度更快,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
字符串拼接的两种方法
程序当中经常出现需要不断接收新字符串并将这些字符串组成新字符串输出的情况。
该方法一般有两种解决方案:
- 创建一个空字符串(test_str),将每次新传入的 new_str 使用 ‘test_str += new_str’ 的方式添加到原有字符串中,返回test_str
- 创建一个空列表(test_list),将每次新传入的 new_str 使用 append(new_str) 的方式添加到列表当中,返回=="".join(test_list)==
效率之间的比较
import time # 装饰器,计算程序运行时间 def start_time(func): def wrapper(*args, **kwargs): start = time.time() res = func(*args, **kwargs) print(func.__name__, time.time() - start) return res return wrapper # 使用 append 和 join 实现连续字符串拼接 @start_time def test_1(frequency, string): s = [] for i in range(frequency): s.append(string) return ''.join(s) # 使用 += 实现连续字符串拼接 @start_time def test_2(frequency, string): s = '' for i in range(frequency): s += string return s name = 'P' for i in range(25): print('\n数据量为2的{}次方'.format(i)) f = 2 ** i test_1(f, name) test_2(f, name)
结论
注:具体测试结果会因硬件性能差别而有较大差异,趋势不会变。
字符串长度在百万以下:
两种方式区别不大,join() 方法会快 25% 左右字符串长度在百万以上:+=的方法所消耗的时间会指数级的增加,(百万以下也指数级增加,只是不明显),join() 方法会有明显优势。
当代码当中的 name 长度越长,+= 方法的弊端就越明显。
分析
Python中字符串是不可变对象,修改字符串就得将原字符串中的值复制,开辟一块新的内存,加上修改的内容后写入到新内存中,以达到“修改”字符串的效果。在使用“+”拼接字符串时,正是使用了重复性的复制、申请新内存、写入值到新内存的工作一遍遍的将字符串的值修改。
而使用join()方法拼接字符串时,会先计算总共需要申请多少内存,然后一次性申请所需内存并将字符串复制过去。这样便省去了重复性的内存申请和写入,节省了时间消耗。
最后
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。