结合node.js和Python

问题描述 投票:121回答:7

Node.js是我们的Web项目的完美匹配,但我们更喜欢Python的计算任务很少。我们还有一个Python代码。我们高度关注速度,如何以异步非阻塞方式从node.js调用Python“worker”的最优雅方式是什么?

python node.js ipc
7个回答
83
投票

对于node.js和Python服务器之间的通信,如果两个进程在同一服务器和TCP / IP套接字上运行,我会使用Unix套接字。对于编组协议,我会采用JSON或protocol buffer。如果线程Python显示出瓶颈,请考虑使用Twisted Python,它提供与node.js相同的事件驱动并发。

如果您喜欢冒险,请学习clojureclojurescriptclojure-py),您将获得与Java,JavaScript(包括node.js),CLR和Python上的现有代码运行和互操作的语言。通过简单地使用clojure数据结构,您可以获得出色的编组协议。


116
投票

这听起来像是ZeroMQ非常合适的场景。它是一个类似于使用TCP或Unix套接字的消息框架,但它更强大(http://zguide.zeromq.org/py:all

有一个库使用zeroMQ来提供一个非常好用的RPC框架。它被称为zeroRPC(http://www.zerorpc.io/)。这是你好世界。

Python“Hello x”服务器:

import zerorpc

class HelloRPC(object):
    '''pass the method a name, it replies "Hello name!"'''
    def hello(self, name):
        return "Hello, {0}!".format(name)

def main():
    s = zerorpc.Server(HelloRPC())
    s.bind("tcp://*:4242")
    s.run()

if __name__ == "__main__" : main()

和node.js客户端:

var zerorpc = require("zerorpc");

var client = new zerorpc.Client();
client.connect("tcp://127.0.0.1:4242");
//calls the method on the python object
client.invoke("hello", "World", function(error, reply, streaming) {
    if(error){
        console.log("ERROR: ", error);
    }
    console.log(reply);
});

或者反之,node.js服务器:

var zerorpc = require("zerorpc");

var server = new zerorpc.Server({
    hello: function(name, reply) {
        reply(null, "Hello, " + name, false);
    }
});

server.bind("tcp://0.0.0.0:4242");

和python客户端

import zerorpc, sys

c = zerorpc.Client()
c.connect("tcp://127.0.0.1:4242")
name = sys.argv[1] if len(sys.argv) > 1 else "dude"
print c.hello(name)

6
投票

如果您安排将Python工作者放在一个单独的进程中(长时间运行的服务器类型进程或按需生成的子进程),那么与它的通信在node.js端将是异步的。 UNIX / TCP套接字和stdin / out / err通信在节点中本质上是异步的。


6
投票

我也考虑Apache Thrift http://thrift.apache.org/

它可以在多种编程语言之间架起桥梁,效率很高,并且支持异步或同步调用。查看http://thrift.apache.org/docs/features/的完整功能

多语言对于未来的计划可能很有用,例如,如果您以后想要在C ++中执行部分计算任务,那么使用Thrift将其添加到混合中非常容易。


5
投票

我使用thoonk.jsthoonk.py取得了很大的成功。 Thoonk利用Redis(内存中的键值存储)为您提供供稿(思考发布/订阅),队列和作业模式以进行通信。

为什么这比unix套接字或直接tcp套接字更好?总体性能可能会有所降低,但是Thoonk提供了一个非常简单的API,可以简化手动处理套接字的过程。 Thoonk还有助于实现分布式计算模型,使您能够扩展python worker以提高性能,因为您只需启动python worker的新实例并将它们连接到同一个redis服务器。


3
投票

我建议使用一些工作队列,例如,使用优秀的Gearman,它将为您提供分派后台作业的好方法,并在处理后异步获取结果。

在Digg(以及其他许多人)中大量使用的优势在于它提供了一种强大,可扩展且强大的方式,使任何语言的工作人员都能与任何语言的客户交谈。


0
投票

更新2019年

有几种方法可以实现这一点,这里的列表按复杂程度递增

  1. Python Shell,您将把流写入python控制台,它会回写给您
  2. Redis Pub Sub,你可以在你的节点js发布者推送数据的同时用Python监听频道
  3. Websocket连接,其中Node充当客户端,Python充当服务器,反之亦然
  4. 与Express / Flask / Tornado等的API连接单独工作,API端点公开,供另一方查询

方法1 Python Shell最简单的方法

source.js文件

const ps = require('python-shell')
// very important to add -u option since our python script runs infinitely
var options = {
    pythonPath: '/Users/zup/.local/share/virtualenvs/python_shell_test-TJN5lQez/bin/python',
    pythonOptions: ['-u'], // get print results in real-time
    // make sure you use an absolute path for scriptPath
    scriptPath: "./subscriber/",
    // args: ['value1', 'value2', 'value3'],
    mode: 'json'
};

const shell = new ps.PythonShell("destination.py", options);

function generateArray() {
    const list = []
    for (let i = 0; i < 1000; i++) {
        list.push(Math.random() * 1000)
    }
    return list
}

setInterval(() => {
    shell.send(generateArray())
}, 1000);

shell.on("message", message => {
    console.log(message);
})

destination.py文件

import datetime
import sys
import time
import numpy
import talib
import timeit
import json
import logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

size = 1000
p = 100
o = numpy.random.random(size)
h = numpy.random.random(size)
l = numpy.random.random(size)
c = numpy.random.random(size)
v = numpy.random.random(size)

def get_indicators(values):
    # Return the RSI of the values sent from node.js
    numpy_values = numpy.array(values, dtype=numpy.double) 
    return talib.func.RSI(numpy_values, 14)

for line in sys.stdin:
    l = json.loads(line)
    print(get_indicators(l))
    # Without this step the output may not be immediately available in node
    sys.stdout.flush()

注意:创建一个名为subscriber的文件夹,该文件夹与source.js文件处于同一级别,并将destination.py放入其中。别忘了改变你的virtualenv环境

© www.soinside.com 2019 - 2024. All rights reserved.