我正在使用由 xgboost 估计器创建的变压器执行 sagemaker 批量转换。用于预测/批量转换的 csv 输入同时具有 ID 列和标题(带有列名称)。例如,这样的事情:
姓名 | 年龄 | 高度 | 重量 |
---|---|---|---|
山姆 | 10 | 2 | 3 |
约翰 | 20 | 3 | 4 |
简 | 30 | 4 | 5 |
当然,需要传递的只是模型输入,没有索引(在本例中为名称)或标题(第一行)
我们可以在创建作业时使用 InputFilter 参数排除索引(即第 0 列)列,如下所示:
DataProcessing = {
"InputFilter": "$[1:]"}
我的问题是如何排除标题?可以使用什么 JSONPath?
CSV 格式似乎不支持标头,因此不认为这里有任何帮助的路径:https://docs.aws.amazon.com/sagemaker/latest/dg/cdf-training.html#cdf -csv格式