Python字符串的字符转换、字符串劈分、字符串合并问题分析
作者:Jiangxl~
1.字符串的字符转换
1.1.字符转换的概念
在前面说的的字符串替换,是将字符串中的一个子串替换成了新的子串,如果我们想对字符串中的某些字符进行转换,也就是对字符串中的单个字符进行替换,可以调用方法maketrans和translate来实现。
首先调用maketrans方法创建一个转换表,在转换表中声明要将那些字符转换成什么字符,然后将创建的转换表作为参数传给translate方法,实现字符的转换。
maketrans方法创建转换表的语法:
str.maketrans('转换的字符', '转换后的字符','删除的字符')
maketrans方法可以传入三个参数:
- 第一个参数用于指定被转换的字符,如果指定了多个字符,那么转换后的字符也需要指定多个,且数量都要相同,被转换的第一个字符会转换成第二个参数中的第一个字符,案例中会说明。
- 第二个参数用于指定转换后的字符。
- 第三个参数用于指定删除那些字符。
定义好一个转换表之后,使用print可以打印这个转换表的内容,此时返回的是一个字典,字典中的每个key:value都是字符对应的ordinal value值。
translate方法将转换表当做参数传入,再被定义的字符串调用,最终实现字符的转换。
1.2.字符转换的应用案例
1)转换表的创建
定义转换表时,如果指定了多个被转换的字符,那么转换后的字符数量要与被转换的字符数量相同,此时第一个参数和第二个参数会交叉转换,代码如下。
contable = str.maketrans('agx', '789') print(contable) ''' 代码解释: str.maketrans('agx', '789')定义了一个转换表,其中字符a转换成字符7,字符g转换成字符8,字符x转换成字符9 当使用print函数打印定义的转换表时,返回的是一个字典,key是被转换的字符,value是转换后的字符,并且返回的是字符的ordinal value值 返回结果:{97: 55, 103: 56, 120: 57} {97是字符a: 55是字符7, 103是字符g: 56是字符8, 120是字符x: 57是字符9} '''
可以使用print函数打印转换表,返回结果是一个字典,在字典中的值是对应字符的ordinal value值,在字典中可以明确的看到什么字符会被转换成什么字符,如下图,97是字符a,55是字符7,97对应的字符会转换成55对应的字符。
除了直接以字符串的形式声明被转换字符和转换后字符的原始值外,还可以使用字典的方法声明转换与被转换的字符,因为转换表返回的结果就是一个字典,但是用的最普遍的方法还是直接在转换表中声明被转换的字符。
#使用字典的形式,在字典中声明转换的字符、被转换字符的原始值 contable = str.maketrans({'a': '7', 'g': '8', 'x': '9'}) print(contable) ''' 此时使用print打印转换表时,就会发现转换后的字符会以原始值的形式记录在字典中,被转换的字符还是以ordinal value值表示 ''' #输出结果:{97: '7', 103: '8', 120: '9'} #还是使用字典的行驶,在字典中声明被转换字符、转换字符的ordinal value值 contable = str.maketrans({97: 55, 103: 56, 120: 57}) print(contable) ''' 这种方法需要实现使用ord函数获取被转换字符、转换字符的ordinal value值,然后在字典中直接声明字符的ordinal value值 ''' #输出结果:{97: 55, 103: 56, 120: 57}
2)字符的转换
#首先定义一个转换表,这个转换表可以被任意字符串调用使用 contable = str.maketrans('agx', '789') #定义一个字符串 mystr = 'jiangxluplader' #使用translate方法将转换表以参数的形式传入,然后由字符串调用这个方法实现字符的转换 print(mystr.translate(contable)) #输出结果:ji7n89lupl7der
发现字符串中所有的a字符都被转换成了7,所有的g字符都被转换成了8,所有的x字符都被转换成了9。
3)maketrans方法定义转换表时 还可以指定要删除的字符,例如删除字符u、p
contable = str.maketrans('agx', '789', 'up') mystr = 'jiangxluplader' print(mystr.translate(contable)) ''' maketrans方法创建转换表时,第三个参数是指定删除的字符 ''' #输出结果:ji7n89ll7der
4)maketrans方法定义转换表中,还可以不对字符进行转换,只对某些字符进行删除,例如只删除字符u、p
contable = str.maketrans('', '', 'up') mystr = 'jiangxluplader' print(mystr.translate(contable)) #输出结果:jiangxllader
当指定第三个参数时,会将指定的字符删除,其实就是将指定的字符设置成了None对象。
2.字符串的劈分
2.1.字符串劈分的概念
所谓的字符串劈分指的是,根据指定的分隔符,将字符串一分为N个,例如字符串“aaa bbb”,默认的分隔符是空格,根据分隔符可以将这个字符串分为“aaa”,“bbb”,这就是字符串的劈分。字符串的劈分共有两种方法:
1)调用方法split或者rsplit劈分字符串
- split方法是从字符串的左侧开始劈分字符串,从前往后开始劈分。
- rsplit方法是从字符串的右侧开始劈分字符串,从后往前开始劈分。
split和rsplit方法会根据分隔符对字符串中所有出现分隔符的地方进行劈分。
默认的分隔符是空格字符串,这两个方法如果不指定最大的劈分次数,输出的内容没有任何区别,并且这两个方法的返回值都是一个列表。
当字符串中没有指定的分隔符时,这两个方法都会返回字符串本身,但是也会将字符串本身放在列表中。
2)调用方法partition或者rpartition劈分字符串
partition和rpartition这两个方法在调用的时候必须指定分隔符,然后对字符串进行劈分,这两个方法对字符串劈分后会返回一个元组。
- partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
- rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
partition方法和rpartition只会将字符串中第一次出现分隔符的位置,进行劈分,一分为三,这就是与split方法的最大区别
partition方法和rpartition两个方法只是开始劈分的位置处不同,然后将字符串劈分为三个元素:
- 分隔符前面的部分
- 分隔符
- 分隔符后面的部分
如果字符串中不存在指定的分隔符,两个方法都会返回字符串本身,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串,rpartition方法劈分的三个元素依次为:空字符串、空字符串、字符串本身。
2.2.调用方法split或者rsplit劈分字符串
1)基本的劈分案例
#原始字符串 mystr = "DevOps Jenkins Kubernetes" #左劈分 print(mystr.split()) #右劈分 print(mystr.rsplit()) ''' 左劈分是从DevOps第一个空格字符串处开始劈分,右劈分是从Kubernetes最后一个空格字符串处开始劈分 默认的劈分字符串是空格字符串,只要遇到空格字符串,就将空格字符串左侧的字符串劈分出来。 '''
可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。
2)通过参数sep指定分隔符劈分字符串
在split和rsplit方法中都可以使用sep参数指定分隔符,从而根据指定的分隔符去劈分字符串。
mystr = "DevOps|Jenkins|Kubernetes" print(mystr.split(sep='|')) print(mystr.rsplit(sep='|')) ''' split(sep='|')、rsplit(sep='|')指定分隔符为“|” '''
可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。
当指定的分隔符字符串不存在时,则会返回字符串本身,但是也会将字符串本身放在列表中。
mystr = "DevOps Jenkins Kubernetes" print(mystr.split(sep='|')) print(mystr.rsplit(sep='|'))
3)通过参数maxsplit指定劈分字符串的最大劈分次数
在split和rsplit方法中都可以使用maxsplit参数指定劈分字符串的最大劈分次数,什么意思呢?原本一个字符串可以被劈分6次,但是我们只需要劈分2次就行,就可以使用maxsplit参数指定指定劈分字符串的最大劈分次数。
当指定了最大的劈分次数时,当超过最大的劈分次数后,剩余的子串会单独作为一部分输出,此时split和rsplit两个劈分方法就会有明显的区别。
#定义原始字符串 mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" ''' 使用split方法是从左往右开始劈分,从第一个子串位置处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么DevOps、Jenkins会被劈分出来作为列表的单独元素,而剩余的子串Kubernetes|Python|Gitlab会被作为一部分放在列表的一个元素内 ''' print(mystr.split(sep='|', maxsplit=2)) #输出结果:['DevOps', 'Jenkins', 'Kubernetes|Python|Gitlab'] ''' 使用rsplit方法是从右往左开始劈分,从最后一个子串处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么Gitlab、Python这两个字符串会被劈分出来作为列表的单独元素,而剩余的字符DevOps|Jenkins|Kubernetes会被作为一部分,放在列表的一个元素内 ''' print(mystr.rsplit(sep='|', maxsplit=2)) #输出结果:['DevOps|Jenkins|Kubernetes', 'Python', 'Gitlab']
当在劈分方法内指定了最大的劈分次数的参数时,split左劈分和rsplit右劈分就会有明显的区别,split方法是从前往后根据分隔符进行劈分,rsplit方法是从后往前根据分隔符进行劈分。
2.3.调用方法partition或者rpartition劈分字符串
partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
这两个方法,只会根据一个分隔符进行劈分字符串,且始终劈分成三个元素,partition方法的分隔符取决于在字符串中第一次出现的分隔符,rpartition方法的分隔符取决于字符串中最后一次出现的分隔符。
1)调用方法partition劈分字符串
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.partition('|')) ''' partition从左往右找到第一次出现分隔字符串的位置,从这里开始劈分字符串,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。 ''' #输出结果:('DevOps', '|', 'Jenkins|Kubernetes|Python|Gitlab')
2)调用方法rpartition劈分字符串
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.rpartition('|')) ''' rpartition从左往右找到最后一次出现分隔字符串的位置,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。 ''' #输出结果:('DevOps|Jenkins|Kubernetes|Python', '|', 'Gitlab')
确实和理论说明的一样,从左往右找到最后一次分隔符出现的位置,分隔符左侧的部分为元组中的第一个元素,分隔符为第二个元素,分隔符右侧的部分为元组中的第三个元素。
3)当字符串中只有一个分隔符字符串且分隔符后没有任何字符时
当字符串中只有一个分隔符字符串时,且分隔符后面没有任何字符串,此时无论是partition方法还是rpartition方法,劈分的字符串第三个元素一定为空。
mystr = "DevOps|" print(mystr.partition('|')) print(mystr.rpartition('|'))
第三个元素取的都是分隔符后面的部分,分隔符后面的部分什么也没有,因此就会输出空字符串。
4)当字符串中不存在指定的分隔符字符串(partition方法)
如果字符串中不存在指定的分隔符,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串。
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.partition('*')) #输出结果:('DevOps|Jenkins|Kubernetes|Python|Gitlab', '', '')
第一个元素是字符串的本身,第二个元素是空字符串,第三个元素也是空字符串。
4)当字符串中不存在指定的分隔符字符串(rpartition方法)
如果字符串中不存在指定的分隔符,rpartition方法劈分的三个元素顺序依次为:空字符串、空字符串、字符串本身。
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.rpartition('*'))
第一个元素是空字符串,第二个元素是空字符串,第三个元素是字符串的本身。
3.字符串的合并
可以调用方法join将多个字符串合并成一个字符串。语法格式如下:
'字符串的间隔符'.join(列表|数组) 字符串的间隔符可以指定,也可以不指定,指定后,每个元素字符串在合并时都会在后面添加一个分隔符。
1)使用join方法将列表中多个字符串进行合并
使用join方法可以将列表中的多个元素,元素也都是字符串,将这些字符串进行合并。
print(''.join(["Python", "Go", "K8S"])) #输出结果:PythonGoK8S
使用join方法将列表中的每个元素合并时添加一个分隔符“|”
print('|'.join(["Python", "Go", "K8S"])) #输出结果:Python|Go|K8S
2)使用join方法将元组中的多个字符串进行合并
join方法也可以将元组中的元素合并。
print('|'.join(("Python", "Go", "K8S"))) #输出结果:Python|Go|K8S
3)可以把字符串看成是字符的列表,然后使用join方法将这些字符合并成字符串
可以把字符串看成是字符的列表,然后使用join将这些字符加上分隔符合并成新的字符串。
print('|'.join("Python")) #输出结果:P|y|t|h|o|n
到此这篇关于Python字符串的字符转换、字符串劈分、字符串合并的文章就介绍到这了,更多相关Python字符串合并内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!