0%

线性回归和逻辑回归

线性回归 Linear Regression

确定两种或两种以上变量间相互依赖的定量关系。

损失函数 Loss Function

找到最好的$\theta$

最小化损失函数

梯度下降

过拟合与正则化

为了防止过拟合,可以通过正则化,将$\theta$放入损失函数,通常过拟合时部分$\theta$会过大。

逻辑回归 Logistic Regression

逻辑回归处理的是一个分类方法,寻找判定边界(decision boundary)

sigmoid函数

能把x映射到(0,1),可用于分类

损失函数

单样本分错的损失

损失函数

矩阵形式

正则化

LR的优势

  • LR能以概率的形式输出结果,而非只是0、1判定,可以做ranking model;
  • LR的可解释性强,可控度高;
  • 训练快,feature engineering之后效果好;

LR的应用

  • CTR预估/推荐系统的learning to rank/各种分类场景;

参考文献

【1】周志华.机器学习.清华大学出版社.P