资源预览内容
第1页 / 共64页
第2页 / 共64页
第3页 / 共64页
第4页 / 共64页
第5页 / 共64页
第6页 / 共64页
第7页 / 共64页
第8页 / 共64页
第9页 / 共64页
第10页 / 共64页
亲,该文档总共64页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
2024/7/251Python语言编程导论语言编程导论第六章第六章字符串字符串内容提要内容提要概述概述通用序列操作通用序列操作字符串格式化字符串格式化字符串方法字符串方法正则表达式简介正则表达式简介2024/7/252一、概述一、概述在在Python中,字符串是除数字外最重要的中,字符串是除数字外最重要的数据类型。字符串无处不在:将字符串输出数据类型。字符串无处不在:将字符串输出到屏幕上;从用户的键盘输入读取字符串;到屏幕上;从用户的键盘输入读取字符串;文件通常被视为大型字符串;网页大部分是文件通常被视为大型字符串;网页大部分是由文本组成的。由文本组成的。字符串是一种聚合数据结构,可充分利用索字符串是一种聚合数据结构,可充分利用索引和切片引和切片用于从字符串中提取子串。用于从字符串中提取子串。而而Python正则表达式库,是一种用来处理正则表达式库,是一种用来处理字符串的微型语言,但功能强大。字符串的微型语言,但功能强大。2024/7/253二、通用序列操作二、通用序列操作Python中,字符串、列表和元组都属于序中,字符串、列表和元组都属于序列。列。序列有一些通用的操作。包括:索引序列有一些通用的操作。包括:索引(indexing)、分片()、分片(slicing)、加)、加(adding)、乘()、乘(multiplying)、检)、检查某个元素是否属于序列的成员(成员资查某个元素是否属于序列的成员(成员资格)、计算序列长度、找出最大元素和最格)、计算序列长度、找出最大元素和最小元素等。小元素等。2024/7/2541、索引、索引序列中的所有元素都是有编号的序列中的所有元素都是有编号的从从0开始开始递增。这些元素可以通过编号分别访问。递增。这些元素可以通过编号分别访问。索引有正索引和负索引,可根据实际情况索引有正索引和负索引,可根据实际情况选用。选用。字符串就是一个由字符组成的序列,处理字符串就是一个由字符组成的序列,处理字符串时,经常需要访问其中的各个字符。字符串时,经常需要访问其中的各个字符。索引索引0指向第指向第1个字符。个字符。2024/7/255例如:字符串例如:字符串apple的正索引和负索引的正索引和负索引2024/7/256例例6-1:字符串索引应用:字符串索引应用2024/7/257执行结果:执行结果:例例6-2:计算给定字符串的编码总和:计算给定字符串的编码总和2024/7/258执行结果:执行结果:2、分片、分片与使用索引访问单个元素类似,可以使用分片操作与使用索引访问单个元素类似,可以使用分片操作来访问一定范围内的元素。分片是实际应用中经常来访问一定范围内的元素。分片是实际应用中经常使用的技术,被截取的部分称为使用的技术,被截取的部分称为“子串子串”Python3支持的分片格式为:支持的分片格式为:Si:j:k表示:索引表示:索引S对象中的元素,从索引为对象中的元素,从索引为i直到索引为直到索引为j-1,每隔,每隔k个元素索引一次,第三个限制个元素索引一次,第三个限制k为步长,为步长,默认为默认为1,也可以使用负数作为步长,步长,也可以使用负数作为步长,步长-1表示表示分片将会从右至左进行而不是通常的从左至右,实分片将会从右至左进行而不是通常的从左至右,实际效果主是将序列反转。际效果主是将序列反转。在在Python中,还可以使用中,还可以使用split()函数来截取字符函数来截取字符串。串。2024/7/259例例6-3:字符串分片:字符串分片2024/7/2510执行结果:执行结果:例例6-4:返回文件名中的扩展名:返回文件名中的扩展名2024/7/2511执行结果:执行结果:2024/7/25123、序列相加(字符串连接、合并)、序列相加(字符串连接、合并)之前介绍过,使用之前介绍过,使用“+”完成。除此之外,还可以完成。除此之外,还可以使用使用join函数和函数和reduce函数实现字符串的合并。函数实现字符串的合并。注意:不同类型的数据不能相加。注意:不同类型的数据不能相加。如:如:4、乘法、乘法用数字用数字x乘以一个序列会生成新的序列,在新的序乘以一个序列会生成新的序列,在新的序列中,原来的序列被重复列中,原来的序列被重复x次。次。如:如:5、成员资格、成员资格为了检查一个值是否在序列中,可以使用为了检查一个值是否在序列中,可以使用in运算符。该运算符检查某个条件是否为运算符。该运算符检查某个条件是否为真,若为真返回真,若为真返回True,否则返回,否则返回False。例如:例如:2024/7/25136、长度、最小值和最大值、长度、最小值和最大值len、min和和max都是内置函数。都是内置函数。len返回序列中包含的元素个数。返回序列中包含的元素个数。min返回序列中的最小值。返回序列中的最小值。max返回序列中的最大值。返回序列中的最大值。例如:例如:2024/7/2514课堂练习一:课堂练习一:课堂练习一2024/7/2515三、字符串格式化三、字符串格式化1、字符串格式化、字符串格式化C语言使用函数语言使用函数printf()格式化输出结果,格式化输出结果,Python也提供了类似功能。也提供了类似功能。Python将若干值插入带有将若干值插入带有“%”标记的字符串中,标记的字符串中,从而可以按照指定格式输出字符串。从而可以按照指定格式输出字符串。语法:语法:%s%str1%s%s%(str1,str2)2024/7/2516例例6-5:格式化字符串:格式化字符串2024/7/2517执行结果:执行结果:例例6-6:带精度的格式化:带精度的格式化2024/7/2518执行结果:执行结果:Python格式化字符串的替代符及含义:格式化字符串的替代符及含义:符号符号描述描述符号符号描述描述%c格式化字符及其格式化字符及其ASCII码码%f格式化浮点数字,可指定小数格式化浮点数字,可指定小数点后的精度点后的精度%s格式化字符串格式化字符串%e用科学计数法格式化浮点数用科学计数法格式化浮点数%d格式化整数格式化整数%E作用同作用同%e%u格式化无符号整数格式化无符号整数%g根据值的大小决定使用根据值的大小决定使用%f或或%e%o格式化无符号八进制数格式化无符号八进制数%G作用同作用同%g%x格式化无符号十六进制数格式化无符号十六进制数%p用十六进制数格式化变量的地用十六进制数格式化变量的地址址%X格式化无符号十六进制数(大格式化无符号十六进制数(大写)写)%若在字符串中输出若在字符串中输出“%”,需,需要使用要使用“%”2024/7/2519例例6-7:符号、对齐和用:符号、对齐和用0填充填充在字段宽度和精度之间还可以放置一个在字段宽度和精度之间还可以放置一个“标志标志”,该标志,该标志可以是零、加号、减号或空格。零表示数字将会用可以是零、加号、减号或空格。零表示数字将会用0填充。填充。2024/7/2520执行结果:执行结果:2、字符串的转义字符、字符串的转义字符计算机中存在可见字符与不可见字符。可见计算机中存在可见字符与不可见字符。可见字符指键盘上的字母、数字和符号。不可见字符指键盘上的字母、数字和符号。不可见字符是指换行、回车、制表符等字符。字符是指换行、回车、制表符等字符。对于不可见字符,对于不可见字符,Python使用的方法类似使用的方法类似于于C语言,都是使用语言,都是使用“”作为转义字符。作为转义字符。Python还提供了函数还提供了函数strip()、lstrip()、rstrip()去除字符串中的转义字符。去除字符串中的转义字符。2024/7/2521Python常用的转义字符及其含义:常用的转义字符及其含义:符号符号描述描述符号符号描述描述反斜线反斜线v纵向制表符纵向制表符单引号单引号r回车符回车符”双引号双引号f换页符换页符a发出系统响铃声发出系统响铃声o八进制数代表的字符八进制数代表的字符b退格符退格符x十六进制数代表的字符十六进制数代表的字符n换行符换行符000终止符,其后的字符串全部忽略终止符,其后的字符串全部忽略t横向制表符横向制表符2024/7/2522例例6-8:转义字符应用:转义字符应用2024/7/2523执行结果:执行结果:四、字符串函数(方法)四、字符串函数(方法)Python字符串自带了大量很有用的函数,要查字符串自带了大量很有用的函数,要查看这些函数,可调用看这些函数,可调用dir并将参数指定为任何字符并将参数指定为任何字符串(如:串(如:dir())。)。虽无必要准确记住所有函数功能,但最好有个大虽无必要准确记住所有函数功能,但最好有个大致了解,这样有益于需要时去查询具体使用。致了解,这样有益于需要时去查询具体使用。字符串函数的详细介绍可参阅其文档字符串或字符串函数的详细介绍可参阅其文档字符串或Python在线文档()。在线文档()。此处介绍常用的字符串函数。此处介绍常用的字符串函数。2024/7/25241、测试函数、测试函数用于检测字符串是否为特定格式的函数,用于检测字符串是否为特定格式的函数,它们组成了一个最大的字符串函数组。它们组成了一个最大的字符串函数组。测试函数都返回测试函数都返回True或或False,因此也称,因此也称为布尔函数或谓词。为布尔函数或谓词。2024/7/2525字符串测试函数:字符串测试函数:函数名函数名何时返回何时返回True函数名函数名何时返回何时返回Trues.endswith(t)s以字符串以字符串t结尾结尾s.islower()s只包含小写字母只包含小写字母s.startswith(t)s以字符串以字符串t打头打头s.isnumeric()s只包含数字只包含数字s.isalnum()s只包含字母和数只包含字母和数字字s.isprintable()s只包含可打印字只包含可打印字符符s.isalpha()s只包含字母只包含字母s.isspace()s只包含空白字符只包含空白字符s.isdecimal()s只包含表示十进只包含表示十进制数字的字符制数字的字符s.istitle()s是个大小写符合是个大小写符合标题要求的字符串标题要求的字符串s.isdigit()s只包含数字字符只包含数字字符s.isupper()s只包含大写字母只包含大写字母s.isidentifier()s是合法的标识符是合法的标识符tinss包含字符串包含字符串t2024/7/2526例如:例如:2024/7/25272、字符串的查找函数、字符串的查找函数函数名函数名返回值返回值s.find(t)若未找到字符串若未找到字符串t,则返回,则返回-1;否则返回;否则返回t在在s中的起始位置中的起始位置s.rfind(t)与与find相同,但从右往左查找相同,但从右往左查找s.index(t)与与find相同,但如果在相同,但如果在s中找不到中找不到t,则,则引发引发ValueError异常异常s.rindex(t)与与index相同,但从右往左查找相同,但从右往左查找2024/7/2528说明:函数说明:函数index和和find之间的差别在于没有找到指定之间的差别在于没有找到指定子串的情形。函数子串的情形。函数index引发异常引发异常ValueError,而函,而函数数find将返回将返回-1。例例6-9:查找函数应用:查找函数应用2024/7/2529执行结果:执行结果:3、字符串的替换函数、字符串的替换函数函数名函数名返回的字符串返回的字符串s.replace(old,new)将将s中的每个中的每个old替换为替换为news.expandtabs(n)将将s中的每个制表符扩展为空格,空格宽度为中的每个制表符扩展为空格,空格宽度为n2024/7/2530Python字符串自带了两个替换函数,如下表所示。字符串自带了两个替换函数,如下表所示。注意:使用替换函数可轻松地删除字符串中的子注意:使用替换函数可轻松地删除字符串中的子串。串。例例6-10:字符串替换:字符串替换2024/7/2531执行结果:执行结果:4、字符串的合并、字符串的合并之前介绍过,之前介绍过,Python可使用可使用“+”连接不连接不同的字符串。同的字符串。除此之外,还可以使用除此之外,还可以使用join函数(是函数(是split方法的逆方法)和方法的逆方法)和reduce函数实现字符串函数实现字符串的合并。的合并。2024/7/2532例例6-11:使用:使用join函数连接字符串函数连接字符串2024/7/2533执行结果:执行结果:例例6-12:使用:使用reduce函数连接字符串函数连接字符串2024/7/2534执行结果:执行结果:5、拆分函数、拆分函数函数函数返回的字符串返回的字符串s.partition(t)将将s拆分为三个字符串(拆分为三个字符串(head、t和和tail),其中),其中head为为t前面的子串,前面的子串,tail为为t后面的子串。返回值为后面的子串。返回值为元组元组s.rpartition(t)与与partition相同,但从相同,但从s的右端开始搜索的右端开始搜索t。返回值。返回值为元组为元组s.split(t)以以t为分隔符,将为分隔符,将s划分成一系列子串,并返回一个由划分成一系列子串,并返回一个由这些子串组成的列表这些子串组成的列表s.rsplit(t)与与split相同,但从相同,但从s的右端开始搜索的右端开始搜索ts.splitlines()返回一个由返回一个由s中的各行组成的列表中的各行组成的列表2024/7/2535拆分函数将字符串拆分成多个子串。如下表所示。拆分函数将字符串拆分成多个子串。如下表所示。例例6-13:拆分字符串:拆分字符串2024/7/2536执行结果:执行结果:例例6-14:使用:使用split()函数获取子串函数获取子串2024/7/2537执行结果:执行结果:6、字符串与日期的转换、字符串与日期的转换在实际应用中,经常需要将日期类型与字在实际应用中,经常需要将日期类型与字符串类型互相转换。符串类型互相转换。Python提供了提供了time模块处理日期和时间。模块处理日期和时间。函数函数strftime()可以实现从时间到字符串可以实现从时间到字符串的转换。的转换。字符串到时间的转换要进行两次转换,需字符串到时间的转换要进行两次转换,需要使用要使用time模块和模块和datetime类。类。2024/7/2538strftime()函数:函数:声明:声明:strftime(format,tuple)-string说明:说明:参数参数format表示格式化日期的特殊字符。例如:表示格式化日期的特殊字符。例如:“%Y-%m-%d”相当于相当于“yyyy-MM-dd”.参数参数tuple表示需要转换的时间,用元组存储。元组中表示需要转换的时间,用元组存储。元组中的元素分别表示年、月、日、时、分、秒。的元素分别表示年、月、日、时、分、秒。函数返回一个表示时间的字符串。函数返回一个表示时间的字符串。2024/7/2539字符串到时间的转换步骤:字符串到时间的转换步骤:第一次转换:调用函数第一次转换:调用函数strptime()将字符串转将字符串转换为一个元组。其声明为:换为一个元组。其声明为:strptime(string,format)-struct_time函数返回一个存放时间的元组。函数返回一个存放时间的元组。第二次转换:将表示年、月、日的第二次转换:将表示年、月、日的3个变量传递个变量传递给函数给函数datetime()。datetime类的类的datetime()函数格式为:函数格式为:datetime(year,month,day,hour,minute,second,microsecond,tzinfo)函数返回一个函数返回一个date类型的变量。类型的变量。2024/7/2540格式化日期的常用标记:格式化日期的常用标记:符号符号描述描述符号符号描述描述%a英文星期的简写英文星期的简写%M分钟数,取值在分钟数,取值在0159之间之间%A英文星期的完整拼写英文星期的完整拼写%j显示从本年第显示从本年第1天开始到当天的天天开始到当天的天数数%b英文月份的简写英文月份的简写%w显示今天是星期几,显示今天是星期几,0表示星期天表示星期天%B英文月份的完整拼写英文月份的完整拼写%W显示当天属于本年的第几周,以星显示当天属于本年的第几周,以星期一作为一周的第一条进行计算期一作为一周的第一条进行计算%c显示本地的日期和时间显示本地的日期和时间%x本地的当天日期本地的当天日期%d日期数,取值在日期数,取值在131之间之间%X本地的当天时间本地的当天时间%H小时数,取值在小时数,取值在0023之间之间%y年份,取值在年份,取值在0099之间之间%I小时数,取值在小时数,取值在0112之间之间%Y年份的完整数字年份的完整数字%m月份,取值在月份,取值在0112之间之间2024/7/2541例例6-15:时间与字符串的互相转换:时间与字符串的互相转换2024/7/2542执行结果:执行结果:7、改变大小写函数、改变大小写函数函数名函数名返回的字符串返回的字符串s.capitalize()将将s0改为大写,其余小写改为大写,其余小写s.lower()让让s的所有字母都小写的所有字母都小写s.upper()让让s的所有字母都大写的所有字母都大写s.swapcase()将小写字母改为大写,并将大写字母改为小写将小写字母改为大写,并将大写字母改为小写s.title()让让s的大小写符合标题的要求的大小写符合标题的要求2024/7/2543说明:在以上函数中,说明:在以上函数中,Python都创建并返回一个新字符都创建并返回一个新字符串,串,Python不会真正修改原字符串。不会真正修改原字符串。例如:例如:2024/7/25448、设置格式函数、设置格式函数函数名函数名返回的字符串返回的字符串s.center(n,ch)包含包含n个字符的字符串,其中个字符的字符串,其中s位于中间,两边用字符位于中间,两边用字符ch填充填充s.ljust(n,ch)包含包含n个字符的字符串,其中个字符的字符串,其中s位于左边,右边用字符位于左边,右边用字符ch填充填充s.rjust(n,ch)包含包含n个字符的字符串,其中个字符的字符串,其中s位于右边,左边边用字位于右边,左边边用字符符ch填充填充s.format(vars)包含用于设置字符串格式的微型语言,详见:包含用于设置字符串格式的微型语言,详见:https:/docs.python.org/3.4/library/string.html#formatspec2024/7/2545例例6-16:设置格式:设置格式2024/7/2546执行结果:执行结果:9、剥除函数、剥除函数函数名函数名返回的字符串返回的字符串s.strip(ch)从从s开头和末尾删除所有包含在字符串开头和末尾删除所有包含在字符串ch中的字符中的字符s.lstrip(ch)从从s开头(左端)删除所有包含在字符串开头(左端)删除所有包含在字符串ch中的字符中的字符s.rstrip(ch)从从s末尾(右端)删除所有包含在字符串末尾(右端)删除所有包含在字符串ch中的字符中的字符2024/7/2547剥除函数用于删除字符串开头或末尾多余的字符。如下表剥除函数用于删除字符串开头或末尾多余的字符。如下表所示。所示。默认情况下,剥除空白字符;如果指定了字符串参数,则默认情况下,剥除空白字符;如果指定了字符串参数,则剥除该字符串中的字符。剥除该字符串中的字符。例例6-17:字符串剥除:字符串剥除2024/7/2548执行结果:执行结果:例例6-18:去除转义字符:去除转义字符2024/7/2549执行结果:执行结果:10、字符串比较、字符串比较Python直接使用直接使用“=”“!=”操作符比较两个操作符比较两个字符串的内容。如果比较的两个变量的类型不相字符串的内容。如果比较的两个变量的类型不相同、比较的内容也不相同。同、比较的内容也不相同。若要比较字符串的部分内容,可以先截取子串,若要比较字符串的部分内容,可以先截取子串,再使用再使用“=”“!=”操作符进行比较。操作符进行比较。若要比较字符串的开头和结尾部分,更方便的方若要比较字符串的开头和结尾部分,更方便的方式是使用式是使用startswith()或或endswith()函数。函数。startswith()与与endswith()的声明为:的声明为:startswith(substring,start,end)endswith(substring,start,end)2024/7/2550例例6-19:字符串比较:字符串比较2024/7/2551执行结果:执行结果:例例6-20:比较字符串开始和结束处:比较字符串开始和结束处2024/7/2552执行结果:执行结果:课堂练习二:课堂练习二:一、假定给定两个字符串(它们可能是空串)一、假定给定两个字符串(它们可能是空串)s1和和s2,要将这两个串合并在一起。要求是:要将这两个串合并在一起。要求是:s1串的第一个字符串的第一个字符与与s2串的第一个字符连在一起,后续以此类推。若一个串的第一个字符连在一起,后续以此类推。若一个串的长度大于另一个串的长度,则保留长串的剩余字符,串的长度大于另一个串的长度,则保留长串的剩余字符,即连接到新串的末尾即可。例如:若即连接到新串的末尾即可。例如:若s1=abcd、s2=efghi,则新串为:,则新串为:aebfcgdhi。编写函数编写函数laceStrings(s1,s2),完成上述功能。,完成上述功能。二、编写函数二、编写函数OnlyCharNum(s),对于给定的字符串,对于给定的字符串只显示字母和数字。只显示字母和数字。2024/7/2553五、正则表达式简介五、正则表达式简介虽然虽然Python字符串提供了众多实用的函数,但实际处理字符串提供了众多实用的函数,但实际处理字符串时,常常需要更强大的工具。鉴于此,字符串时,常常需要更强大的工具。鉴于此,Python提提供了一种用于复杂字符串处理的微型语言供了一种用于复杂字符串处理的微型语言正则表达式,正则表达式,但但正则表达式并不是正则表达式并不是Python的一部分。的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如的语法以及一个独立的处理引擎,效率上可能不如str自自带的方法,但功能十分强大。带的方法,但功能十分强大。实际上,正则表达式是一种实际上,正则表达式是一种简练描绘一组字符串的方式,可用于高效地执行常见的字简练描绘一组字符串的方式,可用于高效地执行常见的字符串处理任务,如匹配、替换和分拆字符串。符串处理任务,如匹配、替换和分拆字符串。使用正则表达式编写一些逻辑验证非常方便,如:电子邮使用正则表达式编写一些逻辑验证非常方便,如:电子邮件及电话号码的格式验证。件及电话号码的格式验证。Python提供了提供了re模块实现正模块实现正则表达式的验证。则表达式的验证。2024/7/25541、正则表达式的构成、正则表达式的构成正则表达式正则表达式是是包含元字符包含元字符(metacharacter)的列表的列表。Python支持的正则表达式元字符和语法支持的正则表达式元字符和语法2024/7/25552、re模块中一些重要函数模块中一些重要函数函函数数描描述述compile(pattern,flags)根据包含正则表达式的字符串创建模根据包含正则表达式的字符串创建模式对象式对象search(pattern,string,flags)在字符串中查找模式在字符串中查找模式match(pattern,string,flags)在字符串的开始处匹配模式在字符串的开始处匹配模式split(pattern,string)根据模式的匹配项来分割字符串根据模式的匹配项来分割字符串findall(pattern.String)列出字符串中模式的所有匹配项列出字符串中模式的所有匹配项sub(pat,repl,string.Count=0)将字符串中所有将字符串中所有pat的匹配项用的匹配项用repl替换替换escape(string)将字符串中所有特殊正则表达式字符将字符串中所有特殊正则表达式字符转义转义2024/7/2556例例6-21:2024/7/25572024/7/25583、re模块中匹配对象的重要方法模块中匹配对象的重要方法方方法法描描述述group(group1,)获取给定子模式(组)的匹配项获取给定子模式(组)的匹配项start(group)返回给定组的匹配项的开始位置返回给定组的匹配项的开始位置end(group)返回给定组的匹配项的结束位置(与分片一样,返回给定组的匹配项的结束位置(与分片一样,不包括组的结束位置)不包括组的结束位置)span(group)返回一个组的开始和结束位置返回一个组的开始和结束位置2024/7/2559例例22:2024/7/2560执行结果:执行结果:例例6-23:编写一个程序,从键盘输入若干字:编写一个程序,从键盘输入若干字符串,当输入符串,当输入done或或quit则结束程序。则结束程序。通常的方法为:通常的方法为:2024/7/2561执行结果:执行结果:使用正则表达式用户输入使用正则表达式用户输入done或或quit结束结束程序:程序:2024/7/2562执行结果:执行结果:例例6-24:假设要识别逗人的字符串:开头为:假设要识别逗人的字符串:开头为一个或多个一个或多个ha,末尾为一个或多个,末尾为一个或多个!2024/7/2563执行结果:执行结果:说明:本函数如果不使用正则说明:本函数如果不使用正则表达式,将非常麻烦。表达式,将非常麻烦。4、关于正则表达式的说明、关于正则表达式的说明Python的的re模块规模庞大,其中有大量模块规模庞大,其中有大量正则表达式函数可用于执行字符串处理任正则表达式函数可用于执行字符串处理任务,如匹配、分拆和替换;还有提高常用务,如匹配、分拆和替换;还有提高常用正则表达式处理速度的技巧,以及众多匹正则表达式处理速度的技巧,以及众多匹配常用字符的捷径。配常用字符的捷径。re模块的文档可参见:模块的文档可参见:2024/7/2564
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号