数理统计与参数估计
常用概念
期望
期望的性质
方差
方差的性质
协方差
协方差的性质
协方差的上界
Pearson相关系数
协方差应用
- 通过相关系数矩阵来优化特征数量(筛选特征)
- 不相关不一定相互独立(可能存在非线性关系),但对于二维正态随机变量,X和Y不相关等价于X与Y相互独立;
距
k阶原点矩
k阶中心距
重要的定理与不等式
Jensen不等式(若f为凸函数)
扩展
连续情况
切比雪夫不等式
切比雪夫不等式说明,X的方差越小,X的取值月集中在期望附近
大数定理
计算Y的期望和方差,带入切比雪夫不等式,通过夹逼定理即可证明。
中心极限定理 Central Limit Theorem
正态分布的应用
实际问题中,很多随机现象可以看做许多因素的独立影响的综合反应(取和),往往近似的服从正态分布:
- 城市的耗电量:大量独立用户耗电量的和;
- 测量误差:各种微小误差的总和(如果是乘性误差需要先取对数);
- 线性回归中,将使用该定理论证最小二乘法的合理性;
用样本估计参数
矩估计
简单粗暴的通过样本分布估计总体分布;