特征缩放是一种在固定范围内标准化数据中存在的独立特征的技术。它在数据预处理期间执行,以处理高度变化的量级或值或单位。如果没有进行特征缩放,那么机器学习算法趋向于权衡更大的值、更高的值,并且将较小的值视为较低的值,而不考虑值的单位。
null
例子: 如果算法不使用特征缩放方法,那么它可以考虑值3000米大于5公里,但这实际上不是真的,在这种情况下,算法将给出错误的预测。因此,我们使用特征缩放将所有值调整到相同的大小,从而解决这个问题。
执行特征缩放的技术 考虑两个最重要的问题:
- 最小最大归一化: 此技术使用分布值在0和1之间的值重新缩放特征或观察值。
- 标准化: 这是一种非常有效的技术,可以重新缩放特征值,使其具有均值为0、方差等于1的分布。
下载数据集: 转到链接并下载 用于功能缩放的数据。csv
代码:Python代码,解释了数据上的特性缩放工作
# Python code explaining How to # perform Feature Scaling """ PART 1 Importing Libraries """ import numpy as np import matplotlib.pyplot as plt import pandas as pd # Sklearn library from sklearn import preprocessing """ PART 2 Importing Data """ data_set = pd.read_csv( 'C:\Users\dell\Desktop\Data_for_Feature_Scaling.csv' ) data_set.head() # here Features - Age and Salary columns # are taken using slicing # to handle values with varying magnitude x = data_set.iloc[:, 1 : 3 ].values print ( "Original data values : " , x) """ PART 4 Handling the missing values """ from sklearn import preprocessing """ MIN MAX SCALER """ min_max_scaler = preprocessing.MinMaxScaler(feature_range = ( 0 , 1 )) # Scaled feature x_after_min_max_scaler = min_max_scaler.fit_transform(x) print ( "After min max Scaling : " , x_after_min_max_scaler) """ Standardisation """ Standardisation = preprocessing.StandardScaler() # Scaled feature x_after_Standardisation = Standardisation.fit_transform(x) print ( "After Standardisation : " , x_after_Standardisation) |
输出:
Country Age Salary Purchased 0 France 44 72000 0 1 Spain 27 48000 1 2 Germany 30 54000 0 3 Spain 38 61000 0 4 Germany 40 1000 1 Original data values : [[ 44 72000] [ 27 48000] [ 30 54000] [ 38 61000] [ 40 1000] [ 35 58000] [ 78 52000] [ 48 79000] [ 50 83000] [ 37 67000]] After min max Scaling : [[ 0.33333333 0.86585366] [ 0. 0.57317073] [ 0.05882353 0.64634146] [ 0.21568627 0.73170732] [ 0.25490196 0. ] [ 0.15686275 0.69512195] [ 1. 0.62195122] [ 0.41176471 0.95121951] [ 0.45098039 1. ] [ 0.19607843 0.80487805]] After Standardisation : [[ 0.09536935 0.66527061] [-1.15176827 -0.43586695] [-0.93168516 -0.16058256] [-0.34479687 0.16058256] [-0.1980748 -2.59226136] [-0.56487998 0.02294037] [ 2.58964459 -0.25234403] [ 0.38881349 0.98643574] [ 0.53553557 1.16995867] [-0.41815791 0.43586695]]
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END