feature_names must be unique - Xgboost(FEATURE_NAMES必须唯一-XgBoost)
本文介绍了FEATURE_NAMES必须唯一-XgBoost的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在为一个非常稀疏的矩阵运行xgBoost模型。
我收到此错误。ValueError:FEATURE_NAMES必须唯一
我如何处理此问题?
这是我的代码。
yprob = bst.predict(xgb.DMatrix(test_df))[:,1]
推荐答案
根据xgboost source code documentation,该错误只出现在one place-在DMatrix内部函数中。以下是源代码摘录:
if len(feature_names) != len(set(feature_names)):
raise ValueError('feature_names must be unique')
因此,这里的错误文本是非常直白的;您的test_df至少有一个重复的特性/列名。
您在此帖子上标记了pandas;这表明test_df是一只 pandas DataFrame。在本例中,DMatrixliterally runs df.columns提取feature_names。请检查test_df中是否有重复的列名,删除或重命名它们,然后重试DMatrix()。
这篇关于FEATURE_NAMES必须唯一-XgBoost的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
编程基础网
本文标题为:FEATURE_NAMES必须唯一-XgBoost
基础教程推荐
猜你喜欢
- 使用生成器和迭代器时 Python 多循环失败 2022-01-01
- 与常规 dict 相比,Python manager.dict() 非常慢 2022-01-01
- Discord.py 缺少必需的参数 2022-01-01
- 由Python将MP3转换为MIDI(类型错误:无法加载插件:mtg-Melodia:Melodia) 2022-01-01
- 尝试制作WhatsApp机器人 2022-01-01
- 在 Celery 工作人员中捕获 Heroku SIGTERM 以优雅地关 2022-01-01
- 用 Python 编写 Fortran 无格式文件 2022-01-01
- pyserial - 可以从线程 a 写入串行端口,是否阻塞从线程 b 读取? 2022-01-01
- 将 x 轴刻度更改为自定义字符串 2022-01-01
- numpy float:比算术运算中内置的慢 10 倍? 2022-01-01
