Python是进行数据分析的优秀语言,主要是因为以数据为中心的Python软件包的奇妙生态系统。 熊猫 是这些软件包中的一个,使导入和分析数据变得更加容易。
熊猫 str.wrap()
是处理长文本数据(段落或消息)的重要方法。当长文本数据超过传递的宽度时,它用于将长文本数据分发到新行或处理选项卡空间。因为这是一个字符串方法, str先生 每次调用此方法之前都必须加前缀。
语法: 系列横截面(宽度,**kwargs)
参数: 宽度: 整数值,定义最大线宽
**夸尔斯 [可选参数] 展开_选项卡: 布尔值,如果为True,则将制表符扩展为空格 替换空白: 布尔值,如果为true,则每个空格字符都将替换为单个空格。 删除空白: 如果布尔值为true,则删除新行开头的空白(如果有) 断章取义: 布尔值(如果为True)会打断长度超过传递宽度的单词。 断开连字符: 如果布尔值为true,则在字符串长度小于宽度的连字符上打断字符串。
返回类型: 带有拆分行/添加字符的序列(’’)
要下载代码中使用的数据集,请单击 在这里
在以下示例中,使用的数据框包含一些NBA球员的数据。任何操作之前的数据帧图像附在下面。
例子: 在本例中,团队列以5个字符的线宽换行。因此将每5个字符放在后面。打印“新团队”列和“旧团队”列中的随机元素以查看工作状态。在应用任何操作之前,使用 .dropna()
方法。
# importing pandas module import pandas as pd # reading csv file from url # dropping null value columns to avoid errors data.dropna(inplace = True ) # display data[ "New Team" ] = data[ "Team" ]. str .wrap( 5 ) # data frame display data # printing same index separately print (data[ "Team" ][ 120 ]) print ( "------------" ) print (data[ "New Team" ][ 120 ]) |
输出: 如输出图像所示,新列已“每隔5个字符。在打印新旧团队列的相同索引后,可以看到,在print语句中不添加新行字符,python会自动读取“在字符串中,并将其放在新的行中。
带有新团队列的数据框-
输出:
Los Angeles Lakers ------------ Los A ngele s Lak ers