我正在构建一个网络应用程序,需要计算数据集的统计信息。我需要计算数组的百分位数、平均值、众数和其他统计函数。
通常在Python中,我只会使用scipy、numpy或nltk,它们有一个巨大的统计数组函数库。我可以利用任何红宝石宝石或库来做到这一点吗?
在没有任何现有库的情况下,是否有一种简单的方法可以在 Python 中进行数据处理,同时将我的应用程序保留在 Ruby/Rails 中?
如果您确实需要完整的统计库,请查看statsample。否则,您可能会发现 descriptive_statistics 是一个不错的轻量级替代方案。
如果您正在计算 ActiveRecord 模型的统计数据,那么您可能需要查看 statistics gem。
我还为提供 GNU-R 集成的 statisticus 和 SIRB 添加了书签,以便在控制台中使用。
在 Rails 应用程序下运行 Python 的方法有很多种,但在 Ruby 库中找到所需的方法可能更容易。
可以使用NMatrix,这是一个正在不断开发中的类似于NumPy的数值库。 (免责声明:我来自 SciRuby/NMatrix 团队)
我已经实现了一个新的 gem“MDArray”,它在 JRuby 中进行统计。这实际上对于 Web 应用程序来说可能非常好,因为 JRuby 基本上是 Java。 MDArray 遵循 NArray 和 Numpy 哲学,尽管目前它可能比两者都慢,但它应该比纯 Ruby 替代方案更快。
检查一下,如果您需要任何帮助,我将很乐意尝试提供帮助。