在一些监督方法中,在 1085 收入电话记录文件中,X =(该文件中包含财务、数字和索赔信息的句子数量)/(该文件中的句子总数)。
令 d 为该收益电话会议的日期(该特定收益电话会议记录是关于该日期的),因此 Y 是与该 X 相对应的当天周围的 5 天波动率。(我使用给定的每个日期的每只股票的价格计算得出在雅虎网站上)
这样我就有了 1085 个标记样本。
我正在尝试使用这些数据训练一些回归模型,但我没有得到很好的结果。