使用gitpython解析git日志

问题描述 投票:0回答:2

在python中,我想获取git存储库中文件的所有提交的日志,并解析日志中的信息(哈希,作者姓名,作者邮件,作者日期,提交者名称,提交者邮件,提交日期和提交消息) 。目前,我可以使用gitpython或通过子进程调用shell命令来获取原始git日志。

使用gitpython:

g=git.Git(path)
loginfo=g.log("--pretty=fuller",'--follow',"<filename>")

使用子进程调用:

lines = subprocess.check_output(
        ['git', 'log','--follow',"--pretty=fuller"," 
         <filename"],stderr=subprocess.STDOUT)

但是,之后我想解析原始日志,但我无法在gitpython中找到合适的库/方法。另外,我希望以python日期时间格式解析日期。你能帮我吗?

python git git-log gitpython
2个回答
1
投票

您可以使用以下命令获取所有存储库提交:

import git
repo = git.Repo("/home/user/.emacs.d")
commits = list(repo.iter_commits("master", max_count=5)))

然后你可以自己确定gitpython提供的数据类型:

dir(commmits[0])

他们之中有一些是:

  • 作者
  • committed_datetime
  • 和细砂
  • 信息
  • 统计

举个例子:

>>> commits[0].author
<git.Actor "azzamsa <[email protected]>">

>>> commits[0].hexsha
'fe4326e94eca2e651bf0081bee02172fedaf0b90'

>>> commits[0].message
'Add ocaml mode\n'

如果要检查提交是否包含文件(如果要从该文件中获取所有提交,则可以使用该文件)。您可以使用:

def is_exists(filename, sha):
    """Check if a file in current commit exist."""
    files = repo.git.show("--pretty=", "--name-only", sha)
    if filename in files:
        return True

然后从文件中获取所有提交:

def get_file_commits(filename):
    file_commits = []
    for commit in commits:
        if is_exists(filename, commit.hexsha):
            file_commits.append(commit)

    return file_commits

例如,我想从'init.el'文件中获取所有提交:

initel_file_commits = get_file_commits('init.el')

>>> initel_file_commits
[<git.Commit "fe4326e94eca2e651bf0081bee02172fedaf0b90">, <git.Commit
"e4f39891fb484a95ea76e8e07244b908e732e7b3">]

看到该功能正常工作:

>>> initel_file_commits[0].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-ocaml.el': {'insertions': 28, 'deletions': 0, 'lines': 28}}

>>> initel_file_commits[1].stats.files
{'init.el': {'insertions': 1, 'deletions': 0, 'lines': 1}, 'modules/aza-calfw.el': {'insertions': 65, 'deletions': 0, 'lines': 65}, 'modules/aza-home.el': {'insertions': 0, 'deletions': 57, 'lines': 57}}

希望能帮助到你。


0
投票

您可以考虑使用PyDriller,它是GitPython的包装器,可以使这些事情变得更容易。有一个叫做get_commits_modified_file()的函数:

gr = GitRepository("repo_path")
commits = gr.get_commits_modified_file("filepath") # this return a list of commits hash

然后你可以这样做:

for commit in RepositoryMining("repo_path", only_commits=commits).traverse_commits():
    # your code here
© www.soinside.com 2019 - 2024. All rights reserved.