我的nlp管道具有一些doc扩展名,它们存储3个项目(一个文件名字符串和两个映射不可序列化对象的字典)。我只想在用户数据中排除不可序列化的键/值对,但保留文件名。
doc.to_disk(path, exclude=['user_data'])
按预期工作,不包括所有用户数据。显然,有一些选项可以替代排除“ user_data_keys”或“ user_data_values”,但我找不到它们的用法说明,而且我想不出任何充分的理由来存储所有没有值的键或没有值的所有值。键!
我只想排除doc.user_data中某些字段的键和值。如果可能的话,怎么做?