我是ML和Kaggle的新手。我正在经历一个Kaggle Challenge的解决方案。 挑战:https://www.kaggle.com/c/trackml-particle-identification 解决方案:https://www.kaggle.com/outrunner/trackml-2-solution-example
在浏览代码时,我注意到作者只使用了train_1文件(而不是train_2,3,......)。
我知道只使用train_1文件背后有一些策略。有人可以解释为什么会这样吗?另外,blacklist_training.zip,train_sample.zip和detector.zip文件有什么用?
我是挑战的组织者之一。 train_1 2 3 ..文件都是等价的。 Outrunner可能已经看到使用更多数据没有改善。
train_sample.zip是一个相当于train_1 2 3的小数据集......为方便起见而提供。
blacklist_training.zip是由于模拟器中的小错误而被忽略的粒子列表(不是很重要)。
detector.zip是进行x y z测量的几何表面的列表。
大卫