Python字符串函数使用详解

Python的友好在于提供了非常好强大的功能函数模块,对于字符串的使用,同样提供许多简单便捷的字符串函数。Python 字符串自带了很多有用的函数,在字符串函数之前先介绍一个非常实用的dir()内置函数,因为对每一个初学者还是大佬级别的python程序员,都不能完全记住所有方法。而该函数可以查看所有这些函数,可调用 dir 并将参数指定为任何字符串(如 dir("")),其返回值包括字符串可以使用的变量、方法和定义的类型。

>>> dir("")
['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__',
 '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', 
 '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 
 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 
 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 
 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

 其也提供对功能函数的查询,比如经常使用的math()函数,所以无论是对后面所阐述的字符串函数还是其它函数,我们都可以用dir()内置函数来了解其它函数的类型、定义等等。下面所讲述的字符串函数会区分其不同功能来分开介绍,其函数的实现功能大致包含以下六个功能:索引特殊字符串、设置字符格式、修改字符串大小写、查看字符串特定格式、替换特定字符串、拆分特定字符串

1 搜索字符串函数

假如我们需要在一段字符串中查找特定的子串时,通常涉及以下几个函数:

函数名

返回值

string.find(i)

如果没有找到子串i,则返回 -1;否则 返回 子串i 在 string 中的起始位置

string.rfind(i)

与 find 相同,但从右往左搜索

string.index(i)

与 find 相同,但如果在 string 中找不到 i, 则引发 ValueError 异常

string.rindex(i)

与 index 相同,但从右往左搜索

虽然这几个函数都实现了搜索特定字符串的功能,但还是包含一些区别的:

1. 函数 index 和 find 之间的差别在于没有找到指定子串时的情形 ,示例如下:

函数index会抛出异常 ValueError,而如果没有找到指定的子串,函数find将返回 -1。

2.字符串搜索函数通常从左往右(从开头往末尾)搜索,但以 r 打头的函数从右往左搜索。例如:

可以看到, 函数 find 和 index 返回传入字符串第一次出现时的起始位置索引,而 rfind 和 rindex 返回传入字符串最后一次出现时的起始位置索引。

2 设置字符串格式函数

下表列出了一些设置字符串格式的函数:

函数名

返回值

string.center(i)

返回一个原字符串居中,并使用空格填充至长度 i 的新字符串

string.ljust(i)

返回一个原字符串左对齐,并使用空格填充至长度 i 的新字符串

string.rjust(i)

返回一个原字符串右对齐,并使用空格填充至长度 i 的新字符串

string.format(i)

提供变量,格式化字符串(python2.6后新增)

center(),ljust()和rjust()函数在日常用的使用很少,反倒是Python2.6以后的format()受到了广大字符串处理者的使用。使用format函数需要给它提供变量或者值,一个简单的例子:字符串中的 {0} 和 {1} 引用 format 的参数:它们将被替换为相应字符串或变量的值。也可以使用关键字参数的名称,

>>> '{0} like eat {1}'.format('Wangzi','banana')
'Wangzi like eat banana'
>>> '{who} {id} is Linda'.format(who='My',id='name')
'My name is Linda'

这是一些比较简单的例子,还有更多细节方面的使用可以参考string — Common string operations — Python 3.10.1 documentation。下面举一个在抓取jmx数值的实际使用案例。在大数据组件使用过程中,我们通常抓取jmx接口的数据获取详情,然后将数据接到相关的展示系统中来监控和展示:例如我们需要抓取一个队列任务扥id,使用者,运行时间等指标值(此处IP做了处理,有问题可以咨询博主)。

import json
import urllib3
import re

def get_ative_resourcemanager(rm1, rm2):
    http = urllib3.PoolManager()
    rm_list = [rm1, rm2]
    for resourcemanager in rm_list:
        url = 'http://{0}/ws/v1/cluster/info'.format(resourcemanager)
        response = http.request('GET', url)
        data = json.loads(response.data)
        ha_state = data['clusterInfo']['haState']
        if ha_state == "ACTIVE":
            return resourcemanager
'''Conversion time function'''
# 毫秒级转化为hour/minutes
def conver_time(allTime):

    hours = (allTime/(60*60*1000))
    return hours

'''get active resourcemanager yarn application metrics'''
def get_queue_metrics():
    active_resoucemanager = get_ative_resourcemanager('ip1:port',
                                                      'ip2:port')
    http = urllib3.PoolManager()
    url = 'http://{0}/ws/v1/cluster/apps'.format(active_resoucemanager)
    response = http.request('GET', url)
    data = json.loads(response.data).get('apps').get('app')
    length = len(data)
    for i in range(length):
        '''判断application状态'''
        application_state = data[i]['state']
        queue = data[i]['queue']
        queue_name = re.findall(r'root.*',queue,re.IGNORECASE)
        #print(mobdi_queue)
        if (application_state == 'RUNNING' or application_state == 'ACCEPTED'):
            if queue_name:
                id_metric = data[i]['id']
                user_metric = data[i]['user']
                queue_metrics = data[i]['queue']
                elapsed_time = data[i]['elapsedTime']
                runtime_metric = conver_time(elapsed_time)
                print(str(id_metric) + " " + str(user_metric) + " " + str(queue_metrics) + " " + str(runtime_metric))

if __name__ == '__main__':
    ''''''
    get_queue_metrics()

执行结果:

3 改变字符串大小写函数

提供改变字符串大小写的函数有以下五个函数:

函数名

返回值

string.capitalize()

字符串的第一个字符大写

string.lower()

将 string 中所有大写字符转为小写

string.upper()

将 string 中的小写字母转为大写

string.swapcase()

转变 string 中的大小写

string.title()

返回"标题化"的 string,就是说所有单词都是以大写开始,其余字母均为小写

Python 提供了各种修改字母大小写的函数,如上表。但注意标红的地方,Python并没有修改字符串,而是在这几个函数中,创建并返回一个新字符串,并没有真正修改string源字符串

4 选定字符串函数

选定字符串函数通常用于删除字符串开头或者末尾多余的字符串,具体有striip,lstrip和rstrip三个函数。

函数名

返回值

string.strip(i)

从string开头和末尾删除所有包含在字符串i中的字符

string.lstrip(i)

从string开头(左端)删除所有包含在字符串i中的字符

string.restrip(i)

从string末尾(右端)删除所有包含在 字符串i中的字符

1.如果不加字符串,将删除空白字符串:

2.删除字符串情况:

5 拆分字符串函数

Python提供了以下几个拆分字符串的函数,主要将字符串拆分成多个子串。

函数名

返回值

string.partition(i)

把string 拆分为三个字符串(head,i和tail),其中 head为i前面的子串, 而 tail 为i后面的子串

string. rpartition(i)

与 partition 相同,但从 string 的右端开始搜索 i

string.split(i)

以 i 为分隔符,将 string 划分成一系列子串,并返回一个由这些子串组成的列表

string.rsplit(i)

与 split 相同,但从 striing 的右端开始搜索 i

string.splitlines(i)

返回一个由 string 中的各行组成的列表

注意示例中存在string和string1两个字符串,函数 partition 和 rpartition 将字符串拆分为3部分,这两个函数总是返回一个这样的值:由3个字符串组成, 形式为 (head, sep, tail) ;而函数 split 以指定字符串为分隔符,将 字符串划分为一系列子串,返回一个字符串列表,列表总是分别以 [ 和 ] 打头和结尾,并用逗号分隔元素。splitlines函数按照行('r', 'rn', n')分隔,返回一个包含各行作为元素的列表,使用很少,而且会自行判断字符串是否包含换行符。

6 替换字符串函数

Python内置两个字符串替换函数,包括:

函数名

返回值

string.replace(old, new)

将 string 中的每个 old 替换为 new

string.expandtabs(i)

将 string 中的每个制表符替换为 n 个 空格

小练习

结合之前的Python字符串使用以及Python本身内置的字符串处理函数,做个小练习,用代码实现自定义的replace_替换函数,实现会在下次的文章中实现。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>