熊猫。因式分解 方法通过标识不同的值来帮助获得数组的数字表示。这种方法既可用也可用 pandas.factorize()
和 Series.factorize()
.
null
参数: 价值观: 1D序列。 排序: [bool,默认值为False]对unique进行排序并洗牌标签。 纳乌哨兵: [int,默认值-1]缺少标记“未找到”的值。
返回: 数组的数值表示
代码:解释factorize()方法的工作原理
# importing libraries import numpy as np import pandas as pd from pandas.api.types import CategoricalDtype labels, uniques = pd.factorize([ 'b' , 'd' , 'd' , 'c' , 'a' , 'c' , 'a' , 'b' ]) print ( "Numeric Representation : " , labels) print ( "Unique Values : " , uniques) |
# sorting the numerics label1, unique1 = pd.factorize([ 'b' , 'd' , 'd' , 'c' , 'a' , 'c' , 'a' , 'b' ], sort = True ) print ( "Numeric Representation : " , label1) print ( "Unique Values : " , unique1) |
# Missing values indicated label2, unique2 = pd.factorize([ 'b' , None , 'd' , 'c' , None , 'a' , ], na_sentinel = - 101 ) print ( "Numeric Representation : " , label2) print ( "Unique Values : " , unique2) |
# When factorizing pandas object; unique will differ a = pd.Categorical([ 'a' , 'a' , 'c' ], categories = [ 'a' , 'b' , 'c' ]) label3, unique3 = pd.factorize(a) print ( "Numeric Representation : " , label3) print ( "Unique Values : " , unique3) |
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END