转眼之间,自己已经从一个学生变成了一个工作一年多的西二旗的IT民工了,记得自己大一的时候懵懵懂懂,高三之前甚至连网吧都没有进过,记得高考查分数的时候,怎么查都不会,分数还是班里一个关系较好的女生给查的。

       我开始接触机器学习的时候是大四,当时刚刚参加完ACM亚洲区域赛,学校里面让我们选择毕业论文题目,我在老师的推荐下选择了毕业论文的题目:基于文本主题的新闻推荐。选择完题目之后,就开始学习机器学习相关的东西了,选题之后毕设老师并没有给与太多的指导,只是让我们查资料,看书。我看的第一本机器学习相关的书是《统计学习方法》,第一个机器学习算法就是决策树,看的一知半解,很多名词不知道什么意思,比方说特征,特征选择,信息熵什么的,也就不太可能看的明白了,后来就放弃看这本书了,转而就去看《机器学习实战》,上网看别人推荐的,但是发现这本书确实不适合我,理论实在是太少,并不适合初学者,又转而去看周志华的《机器学习》但是发现也不怎么看的明白,因为书中很多理论或者等式都是“显然”,“容易证得”,最终自己陷入了一个茫然的阶段,不知道如何处理这些问题。

       因为自己在ACM亚洲区域赛中获得了银奖,所以最后在Ryan的内推下,去了百度实习,接触到了很多厉害的前辈,Ryan平时也在代码和理论层面上给与了一些指导,在实习的时间里面,下班时看理论,有的东西不是很明白问问前辈,代码层面上也有了很大的进步,上班的时候在完成任务的同时也阅读了别人的代码。

       实习结束过后,我很快就将本科毕业论文的实验做完,在做实验的过程当中发现,在百度实习的这段时间里,自己有了很大的进步,无论在代码层面上还是理论层面上。在这里还要感谢Ryan和那几位前辈,给与了我很大的支持。

 

       我的理论学习过程:

       我在学习机器学习算法的时候,有一个主线,就是文本分类,我从网上找到了很多文本的数据集,我在学习大部分算法的时候都用了机器学习算法进行文本分类,比如贝叶斯,决策树,LR,集成学习,LSA + KNN,PLSA + KNN乃至后面的深度学习方法。做实验时,比较各中算法。这样在一个主线的带领下,慢慢的很多算法就落地了,一根主线慢慢变成了一棵树。

       个人感悟:

       在学习机器学习时,大部分时候是需要自己学习,自己理解的,在学习算法时,应该尽量将算法落地,也就是做实验。

      但是在整个学习初期,尤其是在刚刚准备的初期,需要有人指导,否则就像是无头苍蝇一样,很难有所突破,就像我在大四初期的时候一样,虽然很多时候别人的指导并不会特别长时间,但是这一层指导会像清风吹开烟雾一样,节约我们的时间,加速我们的学习进程,而且能够加深我们的理解。

       想要获取更多机器学习、深度学习、自然语言处理、计算机视觉相关资料,添加Jews老师微信:Jews_nlp 更有顶尖论文、项目经验以及面试经验分享,干货多多,不容错过!