Filter Dataframe Based on Differnce Between Columns [Not Next-to-Next Columns](根据列之间的差异过滤数据帧[不是下一列])
本文介绍了根据列之间的差异过滤数据帧[不是下一列]的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个唯一的数据帧df:
name val_1 val_2 val_3 val_4
AAA 1 2 3 11
BBB 2 3 5 9
CCC 6 4 15 10
我只需要保留其中任何右侧val列从前面的任何val列增加10的名称,否则删除它们。
我知道diff()和ge()在这里会有帮助,但不确定如果不是关于下一列之间的差异,它们将如何工作。
所需输出:
name
AAA #val_4 increases by 10 from val_1
CCC #val_3 increases by 11 from val_2
做这件事最聪明的方式是什么?如有任何建议,我们将不胜感激。谢谢!
推荐答案
我认为它正在做所需的工作。请注意,我将val_1的第二个值更改为20,这样我们就可以确保我们不会得到从左到右的差异,而不仅仅是从右到左的差异。
import pandas as pd
df = pd.DataFrame(
{
'name': ['AAA', 'BBB', 'CCC'],
'val_1': [1, 20, 6],
'val_2': [2, 3, 4],
'val_3': [3, 5, 15],
'val_4': [11, 9, 10]
}
)
df = df.set_index("name")
f = lambda x: max( [ x[:i][-1] - min(x[:i][:-1]) for i in range(2,len(x)+1)] )
df = df[df.apply(f, axis=1) >= 10]
print(df.index.to_list())
这篇关于根据列之间的差异过滤数据帧[不是下一列]的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
编程基础网
本文标题为:根据列之间的差异过滤数据帧[不是下一列]
基础教程推荐
猜你喜欢
- 将 x 轴刻度更改为自定义字符串 2022-01-01
- 尝试制作WhatsApp机器人 2022-01-01
- 在 Celery 工作人员中捕获 Heroku SIGTERM 以优雅地关 2022-01-01
- 使用生成器和迭代器时 Python 多循环失败 2022-01-01
- numpy float:比算术运算中内置的慢 10 倍? 2022-01-01
- 与常规 dict 相比,Python manager.dict() 非常慢 2022-01-01
- 由Python将MP3转换为MIDI(类型错误:无法加载插件:mtg-Melodia:Melodia) 2022-01-01
- 用 Python 编写 Fortran 无格式文件 2022-01-01
- pyserial - 可以从线程 a 写入串行端口,是否阻塞从线程 b 读取? 2022-01-01
- Discord.py 缺少必需的参数 2022-01-01
