有没有办法在使用Group.visititems时获取数据集或组的父级?

问题描述 投票:1回答:1

我试图将一个h5py File对象放入一个树结构中,以便我可以使用它的能力打印出一个树的表示来显示文件的内容,就像linux“tree”命令以递归方式显示内容一样一个目录。递归访问文件中所有项目的最佳方法是使用Group.visititems方法并传入我将用于向树中添加节点的函数。这是我到目前为止:

import h5py
import argparse
import sys
from anytree import Node, RenderTree

class HDFTree:
    def __init__(self,filename):
        self._file = h5py.File(filename,'r')
        self._root = Node(filename)
        self._node_map = {filename:self._root}
        self._create_tree()

    def _add_node(self,name,item):
        #TODO: Figure out way to get parent of fnode
        parent_node = self._node_map[item.parent] # I don't think item.parent is a thing so this wont work
        self._node_map[name] = Node(name,parent=parent_node)

    def _create_tree(self):
        self._file.visititems(self._add_node)

    def print_tree(self):
        print(RenderTree(self._root))

    def __del__(self):
        self._file.close()
python python-3.x h5py
1个回答
1
投票

在意识到Dataset和Group类确实都具有父属性(hpaulj在问题评论中也指出)和一些清理数据之后,我能够得到我想要的输出:

import h5py
import os
from anytree import Node, RenderTree

class HDFTree:
    def __init__(self,filepath):
        self._file = h5py.File(filepath,'r')
        _,filename = os.path.split(filepath)
        root_name,_ = os.path.splitext(filename)
        self._root = Node(root_name)
        self._node_map = {'':self._root}
        self._create_tree()

    def _add_node(self,name,item):
        _,parent_name = os.path.split(item.parent.name)
        parent_node = self._node_map[parent_name]
        _,child_name = os.path.split(name)
        self._node_map[child_name] = Node(child_name,parent=parent_node)

    def _create_tree(self):
        self._file.visititems(self._add_node)

    def print_tree(self):
        print(RenderTree(self._root))

    def __del__(self):
        self._file.close()

Dataset和Group类的name属性显然给出了完整的hdf5路径,所以我用一些os.path函数清理它。

© www.soinside.com 2019 - 2024. All rights reserved.