蟒蛇熊猫系列。str.partition（）-yiteyi-C++库

Python是进行数据分析的优秀语言，主要是因为以数据为中心的Python软件包的奇妙生态系统。熊猫是这些软件包中的一个，使导入和分析数据变得更加容易。

null

熊猫 str.partition() 类似于 str.split() 。它不会在每次出现分隔符/分隔符时拆分字符串，而是拆分字符串 只有在第一次发生的时候。 在split函数中，分隔符不存储在任何地方，只有其周围的文本存储在新的列表/数据框中。但是在 str.partition() 方法时，也会存储分隔符。

str先生 每次调用此方法之前都必须加前缀，以将其与Python的默认函数区分开来，否则将抛出错误。

语法： 系列str.partition（pat=”，expand=True）

参数：

拍打： 字符串值、分隔符或分隔符来分隔字符串。默认值为“”（空白） 扩展： 布尔值，如果为True，则返回在不同列中具有不同值的数据帧。否则它将返回一个包含字符串列表的序列。默认是真的。

返回类型： 列表或数据框系列，取决于展开参数

要下载代码中使用的CSV，请单击在这里

在以下示例中，使用的数据框包含一些员工的数据。任何操作之前的数据帧图像附在下面。图片[1]-蟒蛇熊猫系列。str.partition（）-yiteyi-C++库

示例#1： 将字符串拆分为列表

在本例中，名称列在第一次出现“，”时被拆分。expand参数保持为False，以便将其扩展为列表而不是数据框。

                       # importing pandas module                     
                       import                                  pandas as pd                     
                                
                       # making data frame                     
                       data                                  =                                  pd.read_csv(                                  "                         https://media.geeksforgeeks.org/wp-content/uploads/chicago.csv                        "                                  )                     
                                
                       # removing null values if any to avoid errors                     
                       data.dropna(how                                  =                                  'all'                                  , inplace                                  =                                  True                                  )                     
                                
                       # displaying top 5 rows of data                     
                       data.head()                     
                                
                       # splitting at ', ' into list                     
                       data[                                  "Name"                                  ]                                  =                                  data[                                  "Name"                                  ].                                  str                                  .partition(                                  ", "                                  ,                                  False                                  )                     
                                
                       # display                     
                       data                     

输出： 如输出图像所示，名称列在第一次出现“，”时被拆分为列表。如图所示，“，”也作为列表的一个单独元素存储。

注：不要被列表中的两个逗号混淆，一个是element，另一个是element separator。

图片[2]-蟒蛇熊猫系列。str.partition（）-yiteyi-C++库

示例2： 将字符串拆分为数据帧

在本例中，名字和姓氏与“名称”列分离，并存储在数据框中的不同列中。

                       # importing pandas module                     
                       import                                  pandas as pd                     
                                
                       # making data frame                     
                       data                                  =                                  pd.read_csv(                                  "                         https://media.geeksforgeeks.org/wp-content/uploads/chicago.csv                        "                                  )                     
                                
                       # removing null values if any to avoid errors                     
                       data.dropna(how                                  =                                  'all'                                  , inplace                                  =                                  True                                  )                     
                                
                       # displaying top 5 rows of data                     
                       data.head()                     
                                
                       # splitting at ', ' into Data frame                     
                       new                                  =                                  data[                                  "Name"                                  ].                                  str                                  .partition(                                  ", "                                  ,                                  True                                  )                     
                                
                       # making separate first name column from new data frame                     
                       data[                                  "First Name"                                  ]                                  =                                  new[                                  2                                  ]                     
                                
                       # making separate last name column from new data frame                     
                       data[                                  "Last Name"                                  ]                                  =                                  new[                                  0                                  ]                     
                                
                       # Dropping old Name columns                     
                       data.drop(columns                                  =                                  [                                  "Name"                                  ], inplace                                  =                                  True                                  )                     
                                
                       # df display                     
                       data                     

输出： 如输出图像所示，名称列被分隔为一个包含3列的数据框（其中一列是逗号前的字符串，另一列是逗号后的字符串）。之后，数据框用于在同一数据框中创建新列。使用删除旧名称列。drop（）方法。

新数据框架- 图片[3]-蟒蛇熊猫系列。str.partition（）-yiteyi-C++库 添加列的数据框- 图片[4]-蟒蛇熊猫系列。str.partition（）-yiteyi-C++库

文章版权归作者所有，未经允许请勿转载。

THE END

Python