线性回归 Linear Regression
确定两种或两种以上变量间相互依赖的定量关系。
损失函数 Loss Function
找到最好的$\theta$
最小化损失函数
梯度下降
过拟合与正则化
为了防止过拟合,可以通过正则化,将$\theta$放入损失函数,通常过拟合时部分$\theta$会过大。
逻辑回归 Logistic Regression
逻辑回归处理的是一个分类方法,寻找判定边界(decision boundary)
sigmoid函数
能把x映射到(0,1),可用于分类
损失函数
单样本分错的损失
损失函数
矩阵形式
正则化
LR的优势
- LR能以概率的形式输出结果,而非只是0、1判定,可以做ranking model;
- LR的可解释性强,可控度高;
- 训练快,feature engineering之后效果好;
LR的应用
- CTR预估/推荐系统的learning to rank/各种分类场景;
参考文献
【1】周志华.机器学习.清华大学出版社.P