我是一位初学者数据科学家,主要使用python,很少使用R。我经常从其他数据科学家那里听到这一点。
“ R不像Python那样好,因为它更难以生产”
我不明白为什么会这样,我得到的响应是(1)您不能对R使用多线程和多处理,并且(2)在具有R的群集中的多个节点上安装库更加困难。但是,我看到了使用parallel
,multidplyr
之类的库进行并行多线程和多处理的方法。像caret
这样的机器学习库似乎也支持多核。
如果真的很难在R中进行生产,为什么要对R社区进行ping操作。
简短地说,R难以用于进行数据挖掘,但它效率更高,而python相反,即:易用但效率低下,因为它消化了大量数据并需要最快的分析以获取见解的复杂应用程序。