Python实现独热码

更新时间:02-02 教程 由 浅殇 分享

ecoding代码演示独热编码的过程。

一、独热编码原理

独热编码将每个分类变量转换为一个二进制向量,其中向量的长度等于总的分类数。对于每个分类变量,只有一个元素为1,其他元素为0。例如,对于一个有三个分类的变量,可以将它们转换为如下的三个二进制向量

分类1[1, 0, 0]

分类2[0, 1, 0]

分类3[0, 0, 1]

这样的转换可以将分类变量转换为机器学习算法更容易处理的形式,同时也避免了分类变量之间的大小关系对模型的影响。

二、独热编码实现方法

eHotEncoder类来实现独热编码。下面是一个简单的例子

gporteHotEncoderportumpyp

原始分类变量p.array(['', 'B', 'C', '', 'B'])

eHotEncoder对象codereHotEncoder()

将分类变量转换为独热码ehotcodersform(categories.reshape(-1,1)).toarray()

tehot)

输出结果为

[[1. 0. 0.]

[0. 1. 0.]

[0. 0. 1.]

[1. 0. 0.]

[0. 1. 0.]]

umpyeHotEncodersformumpy数组,并输出结果。

eHotEncoder类只能处理整数或字符串类型的分类变量,如果需要处理其他类型的变量,需要进行类型转换。

eHotEncoder类来实现独热编码。本文通过一个简单的例子演示了独热编码的实现过程。

声明:关于《Python实现独热码》以上内容仅供参考,若您的权利被侵害,请联系13825271@qq.com
本文网址:http://www.25820.com/tutorial/14_2159990.html