Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。Pandas就是其中之一,它使导入和分析数据变得更加容易。
熊猫 str.slice()
方法用于从对象中存在的字符串中分割子字符串。它非常类似于Python在[start:stop:step]上切片对象的基本原理,这意味着它需要三个参数,从哪里开始,在哪里结束,以及跳过多少元素。 因为这是一个字符串方法, str先生 每次调用此方法之前都必须加前缀。否则,它会给出一个错误。
语法: 系列str.slice(开始=无,停止=无,步骤=无)
参数: 开始: int值,指示从何处开始切片 停止: int值,指示结束切片的位置 步骤: int值,指示在切片过程中要步进多少个字符
返回类型: 带切片子串的级数
要下载代码中使用的CSV,请单击 在这里
在以下示例中,使用的数据框包含一些NBA球员的数据。任何操作之前的数据帧图像附在下面。 示例#1: 在本例中,薪资列已被切片,以获取小数点之前的值。例如,我们想做一些数学运算,为此我们需要整数数据,所以薪水列将被切片到最后的第二个元素(-2个位置)。 由于salary列作为float64数据类型导入,因此首先使用。astype()方法。
# importing pandas module import pandas as pd # making data frame # removing null values to avoid errors data.dropna(inplace = True ) # start stop and step variables start, stop, step = 0 , - 2 , 1 # converting to string data type data[ "Salary" ] = data[ "Salary" ].astype( str ) # slicing till 2nd last element data[ "Salary (int)" ] = data[ "Salary" ]. str . slice (start, stop, step) # display data.head( 10 ) |
输出: 如输出图像所示,字符串已被切片,小数点之前的字符串存储在新列中。 注: 此方法没有任何参数来处理空值,因此已使用删除它们。dropna()方法。 示例2: 在本例中,名称列被分割,步骤参数保留为2。因此,它将在切片过程中步进两个字符。
# importing pandas module import pandas as pd # making data frame # removing null values to avoid errors data.dropna(inplace = True ) # start stop and step variables start, stop, step = 0 , - 2 , 2 # slicing till 2nd last element data[ "Name" ] = data[ "Name" ]. str . slice (start, stop, step) # display data.head( 10 ) |
输出: 正如在输出图像中所看到的,名称被切片,切片过程中跳过了2个字符。