How to get original values after using factorize() in Python?(在Python中使用factorize()后如何获取原始值?)
本文介绍了在Python中使用factorize()后如何获取原始值?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我是一个初学者,正在尝试使用Python中的随机森林,使用训练和测试数据集来创建预测模型。序列["允许/阻止"]可以取4个预期值中的1个(所有字符串)。测试["允许/阻止"]是需要预测的。
y,_ = pd.factorize(train["ALLOW/BLOCK"])
y
Out[293]: array([0, 1, 0, ..., 1, 0, 2], dtype=int64)
我使用predict进行预测。
clf.predict(test[features])
clf.predict(test[features])[0:10]
Out[294]: array([0, 0, 0, 0, 0, 2, 2, 0, 0, 0], dtype=int64)
如何获取原始值而不是数值?以下代码是否确实比较了实际值和预测值?
z,_= pd.factorize(test["AUDIT/BLOCK"])
z==clf.predict(test[features])
Out[296]: array([ True, False, False, ..., False, False, False], dtype=bool)
推荐答案
首先,您需要将pd.factorize返回的label保存如下:
y, label = pd.factorize(train["ALLOW/BLOCK"])
得到数值预测后,您可以通过label[pred]:
pred = clf.predict(test[features])
pred_label = label[pred]
pred_label包含具有原始值的预测。
不,您不应该重新分解测试预测,因为标签很可能是不同的。请考虑以下示例:
pd.factorize(['a', 'b', 'c'])
# (array([0, 1, 2]), array(['a', 'b', 'c'], dtype=object))
pd.factorize(['c', 'a', 'b'])
# (array([0, 1, 2]), array(['c', 'a', 'b'], dtype=object))
因此标签取决于元素的顺序。
这篇关于在Python中使用factorize()后如何获取原始值?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
编程基础网
本文标题为:在Python中使用factorize()后如何获取原始值?
基础教程推荐
猜你喜欢
- pyserial - 可以从线程 a 写入串行端口,是否阻塞从线程 b 读取? 2022-01-01
- 与常规 dict 相比,Python manager.dict() 非常慢 2022-01-01
- numpy float:比算术运算中内置的慢 10 倍? 2022-01-01
- 用 Python 编写 Fortran 无格式文件 2022-01-01
- Discord.py 缺少必需的参数 2022-01-01
- 将 x 轴刻度更改为自定义字符串 2022-01-01
- 由Python将MP3转换为MIDI(类型错误:无法加载插件:mtg-Melodia:Melodia) 2022-01-01
- 在 Celery 工作人员中捕获 Heroku SIGTERM 以优雅地关 2022-01-01
- 尝试制作WhatsApp机器人 2022-01-01
- 使用生成器和迭代器时 Python 多循环失败 2022-01-01
