我正在寻找一种方法对pandas数据帧数据进行断言编程,就像在R中的assertr
一样。
有没有方便的图书馆?所有建议都非常欢迎。
我不知道与Pandas专门集成的类似库,但assert
是Python中的内置关键字,您可以使用它来验证数据管道中各个点的数据。
语法很简单:
assert [condition]
如果是真的,没有任何反应如果错误,则会引发AssertionError
。
要验证Pandas数据,您可以编写如下语句:
import pandas as pd
import seaborn as sns
iris = sns.load_dataset('iris')
# throws an exception if there are negative values in the sepal_length column
assert (iris['sepal_length'] > 0).all()
我找到了自己问题的答案:engarde正是我所寻找的。