蟒蛇|熊猫。因式分解

熊猫。因式分解 方法通过标识不同的值来帮助获得数组的数字表示。这种方法既可用也可用 pandas.factorize() Series.factorize() .

null

参数: 价值观: 1D序列。 排序: [bool,默认值为False]对unique进行排序并洗牌标签。 纳乌哨兵: [int,默认值-1]缺少标记“未找到”的值。

返回: 数组的数值表示

代码:解释factorize()方法的工作原理

# importing libraries
import numpy as np
import pandas as pd
from pandas.api.types import CategoricalDtype
labels, uniques = pd.factorize([ 'b' , 'd' , 'd' , 'c' , 'a' , 'c' , 'a' , 'b' ])
print ( "Numeric Representation : " , labels)
print ( "Unique Values : " , uniques)


图片[1]-蟒蛇|熊猫。因式分解-yiteyi-C++库

# sorting the numerics
label1, unique1 = pd.factorize([ 'b' , 'd' , 'd' , 'c' , 'a' , 'c' , 'a' , 'b' ],
sort = True )
print ( "Numeric Representation : " , label1)
print ( "Unique Values : " , unique1)


图片[2]-蟒蛇|熊猫。因式分解-yiteyi-C++库

# Missing values indicated
label2, unique2 = pd.factorize([ 'b' , None , 'd' , 'c' , None , 'a' , ],
na_sentinel = - 101 )
print ( "Numeric Representation : " , label2)
print ( "Unique Values : " , unique2)


图片[3]-蟒蛇|熊猫。因式分解-yiteyi-C++库

# When factorizing pandas object; unique will differ
a = pd.Categorical([ 'a' , 'a' , 'c' ], categories = [ 'a' , 'b' , 'c' ])
label3, unique3 = pd.factorize(a)
print ( "Numeric Representation : " , label3)
print ( "Unique Values : " , unique3)


图片[4]-蟒蛇|熊猫。因式分解-yiteyi-C++库

© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享