Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 熊猫 是这些软件包中的一个,使导入和分析数据变得更加容易。
Pandas提供了一种围绕传递的分隔符或分隔符拆分字符串的方法。之后,该字符串可以存储为系列中的列表,也可以用于从单个分隔字符串创建多列数据帧。 rsplit()
其工作方式与 .split()
方法但是 rsplit()
从右边开始分裂。当分隔符/分隔符出现多次时,此函数也很有用。
str先生 每次调用此方法之前都必须加前缀,以将其与Python的默认函数区分开来,否则会出现错误。
语法: 系列str.rsplit(pat=None,n=-1,expand=False)
参数: 拍打: 字符串值、分隔符或分隔符来分隔字符串。 n: 单个字符串中的最大分隔数,默认值为-1,表示全部。 扩展: 布尔值,如果为True,则返回在不同列中具有不同值的数据帧。否则它将返回一个包含字符串列表的序列
返回类型: 列表或数据框系列,取决于展开参数
要下载使用的Csv文件,请单击 在这里
在以下示例中,使用的数据框包含一些NBA球员的数据。任何操作之前的数据帧图像附在下面。 示例#1: 将字符串从右侧拆分为列表
在本例中,团队列中的字符串在每次出现“t”时被拆分。n参数保留为1,因此同一字符串中的最大拆分数为1。由于使用了rsplit(),字符串将从右侧分开。
# importing pandas module import pandas as pd # reading csv file from url # dropping null value columns to avoid errors data.dropna(inplace = True ) # new data frame with split value columns data[ "Team" ] = data[ "Team" ]. str .rsplit( "t" , n = 1 , expand = False ) # display data |
输出: 如输出图像所示,字符串在“凯尔特人”中的“t”和“波士顿”中的“t”处被拆分。这是因为分离的顺序是相反的。由于expand参数保持为False,因此返回了一个列表。
示例2: 使用字符串创建独立的列。rsplit()
在本例中,Name列在空格(“”)处分隔,expand参数设置为True,这意味着它将返回一个数据框,其中所有分隔的字符串位于不同的列中。然后使用该数据框创建新列,并使用.drop()方法删除旧的Name列。
n参数保留为1,因为也可以有中间名(字符串中有多个空格)。在本例中,rsplit()非常有用,因为它从右侧开始计数,因此中间的名称字符串将包含在“名字”列中,因为最大分隔数保持为1。
# importing pandas module import pandas as pd # reading csv file from url # dropping null value columns to avoid errors data.dropna(inplace = True ) # new data frame with split value columns new = data[ "Name" ]. str .split( " " , n = 1 , expand = True ) # making separate first name column from new data frame data[ "First Name" ] = new[ 0 ] # making separate last name column from new data frame data[ "Last Name" ] = new[ 1 ] # Dropping old Name columns data.drop(columns = [ "Name" ], inplace = True ) # df display data |
输出: 如输出图像所示,创建了两个新列,删除了旧名称列。