Python |使用str.rsplit()将字符串反向拆分为两个列表/列

Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 熊猫 是这些软件包中的一个,使导入和分析数据变得更加容易。

null

Pandas提供了一种围绕传递的分隔符或分隔符拆分字符串的方法。之后,该字符串可以存储为系列中的列表,也可以用于从单个分隔字符串创建多列数据帧。 rsplit() 其工作方式与 .split() 方法但是 rsplit() 从右边开始分裂。当分隔符/分隔符出现多次时,此函数也很有用。

str先生 每次调用此方法之前都必须加前缀,以将其与Python的默认函数区分开来,否则会出现错误。

语法: 系列str.rsplit(pat=None,n=-1,expand=False)

参数: 拍打: 字符串值、分隔符或分隔符来分隔字符串。 n: 单个字符串中的最大分隔数,默认值为-1,表示全部。 扩展: 布尔值,如果为True,则返回在不同列中具有不同值的数据帧。否则它将返回一个包含字符串列表的序列

返回类型: 列表或数据框系列,取决于展开参数

要下载使用的Csv文件,请单击 在这里

在以下示例中,使用的数据框包含一些NBA球员的数据。任何操作之前的数据帧图像附在下面。 图片[1]-Python |使用str.rsplit()将字符串反向拆分为两个列表/列-yiteyi-C++库 示例#1: 将字符串从右侧拆分为列表

在本例中,团队列中的字符串在每次出现“t”时被拆分。n参数保留为1,因此同一字符串中的最大拆分数为1。由于使用了rsplit(),字符串将从右侧分开。

# importing pandas module
import pandas as pd
# reading csv file from url
# dropping null value columns to avoid errors
data.dropna(inplace = True )
# new data frame with split value columns
data[ "Team" ] = data[ "Team" ]. str .rsplit( "t" , n = 1 , expand = False )
# display
data


输出: 如输出图像所示,字符串在“凯尔特人”中的“t”和“波士顿”中的“t”处被拆分。这是因为分离的顺序是相反的。由于expand参数保持为False,因此返回了一个列表。 图片[2]-Python |使用str.rsplit()将字符串反向拆分为两个列表/列-yiteyi-C++库

示例2: 使用字符串创建独立的列。rsplit()

在本例中,Name列在空格(“”)处分隔,expand参数设置为True,这意味着它将返回一个数据框,其中所有分隔的字符串位于不同的列中。然后使用该数据框创建新列,并使用.drop()方法删除旧的Name列。

n参数保留为1,因为也可以有中间名(字符串中有多个空格)。在本例中,rsplit()非常有用,因为它从右侧开始计数,因此中间的名称字符串将包含在“名字”列中,因为最大分隔数保持为1。

# importing pandas module
import pandas as pd
# reading csv file from url
# dropping null value columns to avoid errors
data.dropna(inplace = True )
# new data frame with split value columns
new = data[ "Name" ]. str .split( " " , n = 1 , expand = True )
# making separate first name column from new data frame
data[ "First Name" ] = new[ 0 ]
# making separate last name column from new data frame
data[ "Last Name" ] = new[ 1 ]
# Dropping old Name columns
data.drop(columns = [ "Name" ], inplace = True )
# df display
data


输出: 如输出图像所示,创建了两个新列,删除了旧名称列。 图片[3]-Python |使用str.rsplit()将字符串反向拆分为两个列表/列-yiteyi-C++库

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享