阅读量:112
在Python中,进行数据预处理的归一化可以使用sklearn库中的MinMaxScaler类。以下是使用MinMaxScaler进行归一化的步骤:
- 导入所需的库和模块:
import numpy as np
from sklearn.preprocessing import MinMaxScaler
- 创建一个样本数据集。这里我们创建一个形状为(10, 5)的二维数组,每一行表示一个样本,每一列表示一个特征:
data = np.array([[10, 20, 30, 40, 50],
[15, 25, 35, 45, 55],
[20, 30, 40, 50, 60],
[25, 35, 45, 55, 65],
[30, 40, 50, 60, 70],
[35, 45, 55, 65, 75],
[40, 50, 60, 70, 80],
[45, 55, 65, 75, 85],
[50, 60, 70, 80, 90],
[55, 65, 75, 85, 95]])
- 初始化MinMaxScaler对象,并设置特征范围。这里我们将特征范围设置为[0, 1]:
scaler = MinMaxScaler(feature_range=(0, 1))
- 使用fit_transform()方法对数据进行归一化:
normalized_data = scaler.fit_transform(data)
- 打印归一化后的数据:
print(normalized_data)
执行以上代码后,将得到归一化后的数据集。请注意,归一化后的数据范围将在[0, 1]之间。