页面树结构

2017-11-09 ApacheCN 开源组织,第二期邀请成员活动,一起走的更远 : http://www.apachecn.org/member/209.html


MachineLearning 优酷地址 : http://i.youku.com/apachecn

转至元数据结尾
转至元数据起始

       学习机器学习需要一定的数学基础,但是仅仅是一点数学基础,不要被这些吓坏了,各位都是大佬,拿起键盘就是干。

       个人认为需要的数学基础:概率论、矩阵论以及微积分。没有也不要紧,边看边学,看到不会的查一下就行了。

        学习推荐书目:中文的话个人推荐李航老师的统计学习方法(书本上没废话,纯干货,适合入门,全部是公式,看这本书个人建议看的时候一定得把公式推导一下,不要似是而非,看着好像是,你推不出来)或者周志华老师的机器学习(本人没完全看过,不做具体评论对比,很多人推荐,不过这本书上面有一些统计学习方法没讲到的地方,比如:模型评估等),实战的话听说机器学习实战不错,我看过一部分,感觉就那样,自己看着办。

       黑榜:数据挖掘—概念与技术。书厚字小,整的跟盗版一样,而且章节安排逻辑上感觉不太合理(个人意见),没兴趣看下去。

       如果喜欢看英文书的话,我也不知道,没坚持看完过哪本书,随便抓一本坚持看完你就牛逼了,列举:《Pattern Recognition and Machine Learning》、《all of statistics》、《The Elements of Statistical Learning》、《deep learning》。都是一些巨作,可以长期拜读。

        如果觉得书本看不下去,千万不要怀疑自己,这个太他妈正常了,可以考虑看一些学习视频,推荐NG吴恩达老师的斯坦福机器学习课程,免费,有相应的教程和作业。建议多方位拜读。

 

        学习路线上来说,个人建议路线:基础模型(K-means、SVM、决策树、线性回归、逻辑回归、贝叶斯)–>  线性模型(逻辑回归/FM)—>非线性模型(GBDT)—>深度学习模型(CNN/RNN)—>多模型综合(gbdt+lr/CNN+LR等)此处列举的主要是目前在推荐系统中使用较多的一些模型,别的我也不知道啊。

      但是我必须说明,机器学习不仅仅包括模型,是一整套系统,个人认为包括:

 

学习模型的方法可以考虑重点关注以下几个方面:

  模型  模型结构  损失函数/代价函数/目标函数 正则化方法 求解方法 模型对比优劣

 

这里列举一些我知道(听说过)的一些东西,大家可以自行学习。

 

损失函数:最小二乘损失/对数损失/指数损失/hinge损失。(排名分先后)

正则化方法:L0/L1/L2/dropout

求解方法:

    基于梯度下降思想: BGD/SGD/Momentum /Nesterov Momentum/AdaGrad/AdaDelta/Adam

基于(拟)牛顿法思想:BFGS /L-BFGS

模型评估:AUC/MAE/权重分布等

 

工业界目前模型的演进过程:

 

特征工程图:

 

  • 无标签