我有一个日期时间索引对象,它包含来自LARGER数据框的随机抽样数据的索引值,我正在训练学习者。我想使用日期时间索引,例如
DatetimeIndex(['1911-11-18', '2015-05-02', '1934-08-15', '1950-09-16',
'1944-06-01', '2004-07-30', '1947-11-18', '1977-07-08',
'1945-05-31', '1944-01-31',
...
'1884-06-24', '1999-11-22', '1960-02-02', '1883-03-08',
'1952-11-19', '1993-02-04', '1965-04-26', '1885-09-30',
'1890-02-26', '2008-03-28'],
dtype='datetime64[ns]', length=300000, freq=None)
每个训练示例返回到完整的数据框并在那些日子查找目标值,然后从那个日期开始将1年用作真正的目标。
总体情况是对来自时间序列数据的随机样本进行培训,并针对未来的值。
我的大数据框叫做学习。我正在训练的样本数据帧称为dataSlice(toLearn的子集)。
对于我想要做的事情,类似下面的东西。
# Find Target 7 years after Each Training Sample
indicesOfTrainSamples=trainSamples.index
indicesOfTarget=indicesOfTrainSamples + pd.Timedelta(weeks=7*52)
targets=[]
for i in indicesOfTarget:
targets.append(toLearn.loc[i])
targetSlices=pd.DataFrame(targets,index=indicesOfTarget)
targetFeature=targetSlices['targetValues']