蟒蛇熊猫系列。str.partition()

Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 熊猫 是这些软件包中的一个,使导入和分析数据变得更加容易。

null

熊猫 str.partition() 类似于 str.split() 。它不会在每次出现分隔符/分隔符时拆分字符串,而是拆分字符串 只有在第一次发生的时候。 在split函数中,分隔符不存储在任何地方,只有其周围的文本存储在新的列表/数据框中。但是在 str.partition() 方法时,也会存储分隔符。

str先生 每次调用此方法之前都必须加前缀,以将其与Python的默认函数区分开来,否则将抛出错误。

语法: 系列str.partition(pat=”,expand=True)

参数:

拍打: 字符串值、分隔符或分隔符来分隔字符串。默认值为“”(空白) 扩展: 布尔值,如果为True,则返回在不同列中具有不同值的数据帧。否则它将返回一个包含字符串列表的序列。默认是真的。

返回类型: 列表或数据框系列,取决于展开参数

要下载代码中使用的CSV,请单击 在这里

在以下示例中,使用的数据框包含一些员工的数据。任何操作之前的数据帧图像附在下面。 图片[1]-蟒蛇熊猫系列。str.partition()-yiteyi-C++库

示例#1: 将字符串拆分为列表

在本例中,名称列在第一次出现“,”时被拆分。expand参数保持为False,以便将其扩展为列表而不是数据框。

# importing pandas module
import pandas as pd
# making data frame
# removing null values if any to avoid errors
data.dropna(how = 'all' , inplace = True )
# displaying top 5 rows of data
data.head()
# splitting at ', ' into list
data[ "Name" ] = data[ "Name" ]. str .partition( ", " , False )
# display
data


输出: 如输出图像所示,名称列在第一次出现“,”时被拆分为列表。如图所示,“,”也作为列表的一个单独元素存储。

注: 不要被列表中的两个逗号混淆,一个是element,另一个是element separator。

图片[2]-蟒蛇熊猫系列。str.partition()-yiteyi-C++库

示例2: 将字符串拆分为数据帧

在本例中,名字和姓氏与“名称”列分离,并存储在数据框中的不同列中。

# importing pandas module
import pandas as pd
# making data frame
# removing null values if any to avoid errors
data.dropna(how = 'all' , inplace = True )
# displaying top 5 rows of data
data.head()
# splitting at ', ' into Data frame
new = data[ "Name" ]. str .partition( ", " , True )
# making separate first name column from new data frame
data[ "First Name" ] = new[ 2 ]
# making separate last name column from new data frame
data[ "Last Name" ] = new[ 0 ]
# Dropping old Name columns
data.drop(columns = [ "Name" ], inplace = True )
# df display
data


输出: 如输出图像所示,名称列被分隔为一个包含3列的数据框(其中一列是逗号前的字符串,另一列是逗号后的字符串)。之后,数据框用于在同一数据框中创建新列。使用删除旧名称列。drop()方法。

新数据框架- 图片[3]-蟒蛇熊猫系列。str.partition()-yiteyi-C++库 添加列的数据框- 图片[4]-蟒蛇熊猫系列。str.partition()-yiteyi-C++库

© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享