将 pgn 数据库转换为 pandas 数据框

Question

你好！

使用 chess.pgn 将国际象棋数据库转换为数据框，要从数据库中读取第 n 个游戏，我需要先读取所有以前的游戏吗？不能直接跳到游戏n？如果我想在有10^8场比赛的数据库中分发处理，我不能在第9e7场比赛开始阅读？

import pandas as pd
import chess.pgn
from datetime import datetime as dt
import os
import glob

nome_arquivo = "Analises_01.pgn"
inicio = 0
numero_jogos = 1.47e8

arquivo = open(nome_arquivo, encoding="utf8")

ratings = []
for j in range(numero_jogos):
    first_game = chess.pgn.read_game(arquivo)
    if j >= inicio:
        try:
            Brancas = int(first_game.headers["WhiteElo"])
            Pretas = int(first_game.headers["BlackElo"])
            ratings.append([Brancas, Pretas])
        except:
            pass

Answer 1

希望这段代码能帮到你。抱歉，我没有使用 Pandas 或数据框。它只会列出一个索引所有 pgn 游戏的列表。所以，

game_index[n]

将返回游戏编号 n+1 的字符串。

PGN = open('your_pgn_path_here.pgn')
text_PGN = PGN.read()
game_index = []
actual_game = ''
for string in text_PGN :
    if string == '\n' :
        if actual_game[-2] == '\n' and actual_game[-1] == '\n' :
            actual_game += string
            game_index.append(actual_game)
            actual_game = ''
        else :
            actual_game += string
    else :
        actual_game += string

Answer 2

import chess.pgn
import pandas as pd

pgn = open("your_pgn_path_here.pgn")

my_list = []
for i in pgn:
    i = chess.pgn.read_game(pgn)
    my_list.append(i)
    df = pd.DataFrame(my_list)

#shows 210 game in dataframe    
print(df[0][210])

Answer 3

可以先用pgn2data等工具将PGN文件转为CSV文件，再将CSV读入pandas：

from converter.pgn_data import PGNData
import pandas as pd

# Convert PGN to CSV
pgn_data = PGNData("Analises_01.pgn")
pgn_data.export() 

# Load the two files created by export() to pandas
game_info_df = pd.read_csv("Analises_01_game_info.csv")
game_moves_df = pd.read_csv("Analises_01_moves.csv")

Analises_01_moves.csv

包含每个移动的行，因此您可能需要执行一些

game_moves_df.groupby

操作以将数据帧合并为一个。

将 pgn 数据库转换为 pandas 数据框

问题描述投票：0回答：3

3个回答

最新问题

将 pgn 数据库转换为 pandas 数据框

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3