Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 熊猫 是使导入和分析数据更容易的软件包之一。
熊猫 Series.str.replace()
方法的工作原理类似于Python .replace()
方法,但它也适用于系列。在打电话之前。在熊猫系列中替换(), str先生 必须加前缀,以区别于Python的默认替换方法。
语法: 系列str.replace(pat,repl,n=-1,case=None,regex=True)
参数: 拍打: 要替换的字符串或编译的正则表达式 答复: 用string或callabe代替pat n: 在单个字符串中进行的替换数,默认值为-1,表示全部。 案例: 采用布尔值来决定大小写敏感度。因案件不敏感而作假 正则表达式: 布尔值,如果为True,则假定传递的模式是正则表达式
返回类型: 具有替换文本值的序列
要下载代码中使用的CSV,请单击 在这里
在以下示例中,使用的数据框包含一些NBA球员的数据。任何操作之前的数据帧图像附在下面。
示例#1: 替换“年龄”列中的值
在本例中,使用str.replace()将年龄列中所有值为25.0的值替换为“二十五” 然后,创建并传入一个过滤器 .where() 方法仅显示包含Age=“二十五”的行。
# importing pandas module import pandas as pd # reading csv file from url # overwriting column with replaced value of age data[ "Age" ] = data[ "Age" ].replace( 25.0 , "Twenty five" ) # creating a filter for age column # where age = "Twenty five" filter = data[ "Age" ] = = "Twenty five" # printing only filtered columns data.where( filter ).dropna() |
输出: 如输出图像所示,Age列中Age=25.0的所有值都已替换为“二十五”。
示例2: 案例不敏感
在本例中,团队名称 波士顿凯尔特人队 被替换为 新波士顿凯尔特人队 .在参数中,不是传递Boston,而是传递Boston(小写为“b”),大小写设置为False,这意味着不区分大小写。之后,只有球队名称为“新波士顿凯尔特人队”的球队才会使用。where()方法。
# importing pandas module import pandas as pd # reading csv file from url # overwriting column with replaced value of age data[ "Team" ] = data[ "Team" ]. str .replace( "boston" , "New Boston" , case = False ) # creating a filter for age column # where age = "Twenty five" filter = data[ "Team" ] = = "New Boston Celtics" # printing only filtered columns data.where( filter ).dropna() |
输出: 如输出图像所示,无论参数中传递的小写字母是什么,Boston都会被New Boston替换。这是因为case参数设置为False。