如何避免每次运行程序时都加载数据?

问题描述 投票:0回答:1

目前,我正在做一个初学者机器学习项目,每次运行我的代码(VSC)都会加载大量数据,这很耗时。例如

with h5py.File('Galaxy10_DECals.h5', 'r') as F:
    images = np.array(F['images'])
    labels = np.array(F['ans'])

加载需要几分钟。我想加载一次数据,然后只扭曲/重新运行我对扭曲/重新运行感兴趣的代码的一部分。

我试图设置断点,但是我需要一些与断点相反的东西(比如“数据代码”之后的起点)。此外,似乎在 VS Code 中,您可以预先选择几行代码并仅运行这些代码。这很难看,因为我需要选择程序的其余部分,除了数据加载模块。

python visual-studio-code machine-learning debugging loading
1个回答
0
投票

正如 Damian Satterthwaite-Phillips 所说,您可以加载 Jupyter notebook 或仅提取少量数据来玩(这也有利于更快地处理数据)。

我的首选是在终端中以交互模式运行代码。只需调用

python3
(或
python
)打开交互式会话并根据需要加载行,或者您可以运行文件并在使用
-i
标志完成后打开交互模式:
python3 -i my_file.py
(您可能需要调整加载,以便数据在全球范围内可用)。从那里,你可以做任何你想做的事,而不必每次都重新加载文件。

© www.soinside.com 2019 - 2024. All rights reserved.