Cythonized pyparser无法正常工作,函数的参数计数错误

问题描述 投票:1回答:2

我有一个Python项目来解析一些汇编代码

asm_parser/
  - asm.py
  - AST.py
  - obj_code.py
  ...

下面的语法中,我已经在成功匹配时设置了这个解析动作类(init函数获取令牌)

self.dir_map_code_fp = pp.OneOrMore(...).setParseAction(Body)

在AST.py中,功能Body.__init__()令牌正在接收中

class Body(Node):
    def __init__(self, tokens):
        super(Body,self).__init__()
        self.code = tokens

然后我使用输入文件字符串在语法上调用parseString()

self.parser_asm.parseString(string, parseAll=True)

为了隐藏源,我正在使用cythonize将这些python文件转换为.so文件。以下是我用来创建.so文件的setup.py文件

class MyBuildExt(build_ext):
    def run(self):
        build_ext.run(self)
        build_dir = Path(self.build_lib)
        root_dir = Path(__file__).parent
        target_dir = build_dir if not self.inplace else root_dir
        self.copy_file(Path('assembler') / '__init__.py', root_dir, target_dir)
        self.copy_file(Path('assembler') / '__main__.py', root_dir, target_dir)

    def copy_file(self, path, source_dir, destination_dir):
        if not (source_dir / path).exists():
            return
        shutil.copyfile(str(source_dir / path), str(destination_dir / path))

if __name__ == '__main__':
    ext_modules = [
        Extension(...) for f in files
    ]

    setup(
        name="myasm",
        ext_modules=cythonize(ext_modules, nthreads=8),
        cmdclass=dict(build_ext=MyBuildExt),
        packages=["asm"]
    )

创建了so文件后,我创建了一个run_asm.py文件来运行asm代码作为包装。我将所有这样的文件模块导入到该run_asm.py

import argparse
from asm import Preprocessor

if __name__ == "__main__":
    argParser = argparse.ArgumentParser(description='Assembler')
    argParser.add_argument('-asm', '--asm', required=True, help="Assembly file")
    argParser.add_argument('-outdir', '--outdir', required=False, default='.', help="default_img directory")
    args = argParser.parse_args()
    prep = Preprocessor()

以纯python形式的项目正在运行。在以cyparon化的.so格式Argparsing中,文件读取所有内容都将起作用,直到parseAction()调用Body.__init__()函数为止。初始化函数只需要两个,这里给出四个]

Traceback (most recent call last):
  File "run_asm.py", line 30, in <module>
    prep.generate_ast(f, args.outdir)
  File "pkg/asm.py", line 145, in pkg.assembler.Preprocessor.generate_ast
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 1206, in parseString
    loc, tokens = self._parse( instring, 0 )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 1072, in _parseNoCache
    loc,tokens = self.parseImpl( instring, preloc, doActions )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 2923, in parseImpl
    loc, tokens = self_expr_parse( instring, loc, doActions, callPreParse=False )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 1072, in _parseNoCache
    loc,tokens = self.parseImpl( instring, preloc, doActions )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 2607, in parseImpl
    return e._parse( instring, loc, doActions )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 1098, in _parseNoCache
    tokens = fn( instring, tokensStart, retTokens )
  File "/u/nalaka/intelpython2/lib/python2.7/site-packages/pyparsing.py", line 819, in wrapper
    ret = func(*args[limit[0]:])
  File "pkg/AST.py", line 28, in pkg.AST.Body.__init__
TypeError: __init__() takes exactly 2 positional arguments (4 given)

我看了pyparsing.py代码,在func下面是Body.__init__()函数。在纯python版本limit[0] = 2中,但是在cythonized版本limit[0] = 0中,因此在两个版本中的参数计数都已更改。我无法获得更多信息。

def wrapper(*args):
    while 1:
        try:
            ret = func(*args[limit[0]:])
            foundArity[0] = True
            return ret

[我也发现parseAction()是可调用的方法,参数为C{fn(s,loc,toks)}, C{fn(loc,toks)}, C{fn(toks)}, or just C{fn()} 0-3。我想知道这与它有什么关系吗(以某种方式弄乱了参数计数)谁能帮我解决这个问题。我正在使用intelpython 2.7,pyparsing-2.4.7和Cython'0.25.2'

python python-2.7 cython pyparsing cythonize
2个回答
0
投票

我不熟悉cythonize,一定会研究它。


0
投票

即使Cython '0.29.17'也出现相同的错误。如果您对python2感到困惑,则此解决方法将有所帮助。即使我将函数定义为def __init__(self, s, loc, tokens):,仍然会出现错误,因为对于匹配相同语法的不同令牌序列,将使用不同数量的参数调用parseAction()中的已注册函数。由于这种动态行为,我修改了函数以接受可变数量的参数。当arg计数为2(包括自我)时,第二个为令牌,当count为4时为最后一个。因此,获得最后一个arg就足够了。

© www.soinside.com 2019 - 2024. All rights reserved.