最快标记信号的方法?

问题描述 投票:1回答:1

我需要找到最快的方法来标记信号。信号的形式为:

identifier:value identifier:value identifier:value ...

identifier仅由字母数字和下划线组成。 identifier与前一个值之间用空格隔开。值可以包含字母数字,大括号/方括号和空格。

例如 signal_id:debug_word12_ind data:{ } virtual_interface_index:0x0000 module_id:0x0001 module_sub_id:0x0016 timestamp:0xcc557366 debug_words:[0x0006 0x0006 0x0000 0x0000 0x0000 0x0000 0xcc55 0x70a9 0x4c55 0x7364 0x0000 0x0000] sequence_number:0x0174

我想出的最好的方法是。理想情况下,我希望将所需时间减半。我已经用正则表达式尝试了各种方法,但是它们并没有更好。有什么建议吗?

# Convert data to dictionary. Expect data to be something like
# parameter_1:a b c d parameter_2:false parameter_3:0xabcd parameter_4:-56

# Split at colons. First part will be just parameter name, last will be just value
# everything in between will be <parameter name><space><value>
parts1 = data.split(":")
parts2 = []
for part in parts1:
    # Copy first and last 'as is'
    if part in (parts1[0], parts1[-1]):
        parts2.append(part)
    # Split everything in between at last space (don't expect parameter names to contain spaces)
    else:
        parts2.extend(part.rsplit(' ', 1))

# Expect to now have [parameter name, value, parameter name, value, ...]. Convert to a dict
self.data_dict = {}
for i in range(0, len(parts2), 2):
    self.data_dict[parts2[i]] = parts2[i + 1]
python performance tokenize
1个回答
0
投票

我对您的解决方案进行了一些优化:

1)从循环中删除了支票。

2)更改了词典创建代码:Pairs from single list

parts1 = data.split(":")

parts2 = []
parts2.append(parts1.pop(0))

for part in parts1[0:-1]:
    parts2.extend(part.rsplit(' ', 1)) 

parts2.append(parts1.pop())


data_dict = {k : v for k, v in zip(parts2[::2], parts2[1::2])}
© www.soinside.com 2019 - 2024. All rights reserved.