是否可以在内存映射文件中存储python对象（特别是sklearn模型）？

Question

我有几个占用大量内存的大型对象（sklearn模型），我想在几个进程之间共享它们。有没有办法做到这一点？

它必须是“实时”对象，而不是序列化版本
我知道有一个numpy数组的内存映射版本，它负责模型内存的重要部分 - 但使用它们需要对sklearn源代码进行重大更改，这很难维护

Answer 1

在从相同的python脚本启动进程的条件下，这是一个创建第二个进程并在两个进程之间共享变量的示例。可以直接详细说明如何创建一些流程。请注意用于创建和访问共享变量和锁的构造。我在算术过程中插入了一个循环以生成一些cpu用法，以便您可以监视并查看它在多核或多处理器平台上的运行方式。还要注意使用共享变量来控制第二个进程，在这个例子中告诉它何时退出。最后，共享对象可以是值或数组，请参阅https://docs.python.org/2/library/multiprocessing.html

#!/usr/bin/python

from time import sleep
from multiprocessing import Process, Value, Lock

def myfunc(counter, lock, run):

    while run.value:
        sleep(1)
        n=0
        for i in range(10000):
            n = n+i*i
        print( n )
        with lock:
            counter.value += 1
            print( "thread %d"%counter.value )

    with lock:
        counter.value = -1
        print( "thread exit %d"%counter.value )

# =======================

counter = Value('i', 0)
run = Value('b', True)
lock = Lock()

p = Process(target=myfunc, args=(counter, lock, run))
p.start()

while counter.value < 5:
    print( "main %d"%counter.value )
    n=0
    for i in range(10000):
        n = n+i*i
    print( n )
    sleep(1)

with lock:
    counter.value = 0

while counter.value < 5:
    print( "main %d"%counter.value )
    sleep(1)

run.value = False

p.join()

print( "main exit %d"%counter.value)

是否可以在内存映射文件中存储python对象（特别是sklearn模型）？

问题描述投票：8回答：1

1个回答

最新问题

是否可以在内存映射文件中存储python对象（特别是sklearn模型）？

问题描述 投票：8回答：1

1个回答

最新问题

问题描述投票：8回答：1