概率与统计

Abstract

概率与统计

Authors

Walter Fan

Status

WIP

Updated

2024-08-21

Overview

Glossary

  • 平均值

\[\mu =\frac{1}{N}\sum_{0}^{n-1}x_i\]
  • 标准差和方差

\[\sigma ^ 2 = \frac{1}{N-1} \sum_{i=0}^{N-1}(x_i - \mu)^2\]

标准差衡量的是信号离平均值有多远,方差衡量的是这种偏离的功率。 对于连续统计,方差可由如下公式计算:

\[\sigma ^ 2 = \frac{1}{N-1} \left [ \sum_{i=0}^{N-1} x_i^2 - \frac{1}{N}\left ( \sum_{i=0}^{N-1} \right ) ^2 \right ]\]
  • 信噪比 SNR \(=\frac{\mu}{\sigma}\)

  • 直方图 Histgram,

    假设 M 是每个采样点可能取值的数目,可用 \(H_i\) 来表示直方图, i 在 0 到 M - 1 之间,\(H_{50}\) 表示采样值是50的采样点的个数,采样点越多,图像就越平滑,直方图的统计噪声与所用采样点数的平方根成反比

直方图中所有值的总和等于信号的采样点总数:

\[N = \sum_{i=0}^{M-1}H_i\]

利用直方图来计算平均值和标准差的公式如下

\[\mu =\frac{1}{N}\sum_{0}^{M-1}i H_i\]
  • 累积分布函数 CDF(Cumulative Distribution Function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

对于随机变量 X, 如下定义的函数 F(x) 称为累积分布函数,简称分布函数,它等于该随机变量小于等于 x 的概率

\[F(x) = P \{ X \le x \} , - \infty < x < + \infty\]
  • 概率质量函数 PMF(probability mass function)

对于一个离散型随机变量 X , 定义它在各个特定取值上的概率为概率质量函数 PMF

\[f(x) = P(X = x)\]
  • 概率密度函数 PDF(probability density function) 也称概率分布函数

对于一个连续型随机变量 X 的累积分布函数 F(x), 如果存在一个定义在实轴上的非负函数 f(x), 使得对于任意实数 x, 有下式成立,则称其为概率密度函数 PDF(probability density function)

\[F(x) = \int_{-\infty }^{x} f(t)dt\]

协方差

设随机变量 X, Y 的期望值分别为 \(\mu \nu\), 此时 X 和 Y 的协方差 convariance 定义如下

\[Cov [ X, Y ] \equiv E [(X - \mu) (Y - \nu)]\]

分布

变量的分布就是描述变量在数据集中的值,以及每个值出现的次数

例子, 新生儿的