何时以及为什么要使用概率密度函数?

问题描述 投票:2回答:1

一个想成为数据科学家的人,我试图理解作为数据科学家,何时以及为什么要使用概率密度函数(PDF)?

分享一个场景和几个指针来了解这个以及CDF和PMF等其他功能将非常有用。从实践的角度知道任何谈论这些功能的书吗?

statistics bigdata data-analysis data-science probability-density
1个回答
3
投票

为什么?

概率论对于现代数据科学和机器学习应用非常重要,因为(在很多情况下)它允许人们“打开一个黑盒子”并为模型的内部工作提供一些亮点,并且运气发现必要将劣质模型转变为伟大模型的成分。没有它,数据科学家的工作在他们能够做的事情上受到很大限制。

PDF是概率论的基本构建块,绝对有必要进行任何类型的概率推理,以及期望,方差,先验和后验等。

这里有一些关于StackOverflow的例子,根据我自己的经验,实际问题归结为理解数据分布:

什么时候?

上面的问题提供了一些例子,如果你感兴趣的话,还有一些例子,列表并不完整:

我个人试图尽可能地找到概率解释(选择损失函数,参数,正则化,架构等),因为这样我可以从盲目猜测转变为做出合理的决定。

这是非常基于意见的,但至少有几本书真的值得一提:The Elements of Statistical LearningAn Introduction to Statistical Learning: with Applications in RPattern Recognition and Machine Learning(如果你的主要兴趣是机器学习)。这只是一个开始,有数十本关于更具体主题的书籍,如计算机视觉,自然语言处理和强化学习。

© www.soinside.com 2019 - 2024. All rights reserved.