将多个系列组合成一个DataFrame(所有系列具有相同的列名)

问题描述 投票:0回答:0

我从 Polygon.io 下载了一些时间序列数据,并将其存储为 DataFrames 的字典。

每个 DataFrame 都有相同的列(“开盘价”、“高价”、“低价”、“收盘价”……)并且它们都有一个标记为“日期”的索引。

我需要从字典中的每个 DataFrame 中取出一列('close')并将它们组合成一个新的 DataFrame,以便生成的 DataFrame 索引是日期,列名是字典中的键。

例如,结果将是一个 DataFrame,其中索引是日期,每列名称将是一个股票代码,每列中的数据将是该代码的收盘价。

尝试使用 pd.concat() 时,我不断收到错误“InvalidIndexError:重新索引仅对具有唯一值的索引对象有效”。

我为这里的格式道歉,我经常使用 StackOverflow,但不确定如何制作漂亮的表格等。

数据= {'SPY':高开...场外交易 日期 ...
2022-03-07 04:00:00 425.9500 427.850 ... 1391.0 无 2022-03-07 05:00:00 425.9800 426.490 ... 663.0 无 2022-03-07 06:00:00 425.2900 427.340 ... 1389.0 无 2022-03-07 07:00:00 427.2400 430.570 ... 5449.0 无 2022-03-07 08:00:00 427.9550 432.424 ... 7496.0 无 ……………… 2023-03-06 15:00:00 404.7218 405.020 ... 109786.0 无 2023-03-06 16:00:00 404.4500 404.740 ... 3785.0 无 2023-03-06 17:00:00 404.6100 404.630 ... 390.0 无 2023-03-06 18:00:00 404.5600 404.760 ... 464.0 无 2023-03-06 19:00:00 404.6900 404.900 ... 564.0 无

[4116 行 x 9 列], 'QQQ': open high low ... 时间戳交易场外交易 日期 ...
2022-03-07 04:00:00 332.92 332.92 331.03 ... 1646643600000 2648 无 2022-03-07 05:00:00 331.80 332.41 331.44 ... 1646647200000 1526 无 2022-03-07 06:00:00 331.46 332.96 330.97 ... 1646650800000 2797 无 2022-03-07 07:00:00 332.91 335.92 332.91 ... 1646654400000 4514 无 2022-03-07 08:00:00 332.96 336.50 330.80 ... 1646658000000 8684 无 ………………………… 2023-03-06 15:00:00 300.59 300.88 299.82 ... 1678132800000 77341 无 2023-03-06 16:00:00 300.02 301.23 299.86 ... 1678136400000 2563 无 2023-03-06 17:00:00 299.98 300.09 299.94 ... 1678140000000 258 无 2023-03-06 18:00:00 299.98 300.29 299.80 ... 1678143600000 503 无 2023-03-06 19:00:00 300.20 300.37 300.07 ... 1678147200000 577 无

[4107 行 x 9 列], 'TQQQ': open high low ... 时间戳交易场外交易 日期 ...
2022-03-07 04:00:00 46.17 46.17 45.36 ... 1646643600000 12057 无 2022-03-07 05:00:00 45.68 46.00 45.54 ... 1646647200000 5462 无 2022-03-07 06:00:00 45.54 46.21 45.31 ... 1646650800000 6093 无 2022-03-07 07:00:00 46.17 47.45 46.14 ... 1646654400000 12292 无 2022-03-07 08:00:00 46.81 47.69 45.21 ... 1646658000000 12140 无 ………………………… 2023-03-06 15:00:00 23.68 23.75 23.50 ... 1678132800000 32363 无 2023-03-06 16:00:00 23.55 23.58 23.51 ... 1678136400000 1892 无 2023-03-06 17:00:00 23.54 23.56 23.51 ... 1678140000000 773 无 2023-03-06 18:00:00 23.52 23.61 23.49 ... 1678143600000 923 无 2023-03-06 19:00:00 23.59 23.63 23.56 ... 1678147200000 777 无

[4107 行 x 9 列]}

python pandas dataframe time-series series
© www.soinside.com 2019 - 2024. All rights reserved.