为什么要先介绍Kaggle
前段时间一直在找工作,在面试过程中经常被问到“你是否有Kaggle排名?”,我说“没有”,然后就被堵“没有,怎么证明你比别人更懂数据科学?”。。。
还是学生时,没有太注意积累这些排名,现在补估计还来得及。
另外,我发现传统的数据科学学习模式,先介绍一大堆的理论和算法,学到后面前面的就忘了,所以我想着是不是可以先介绍一个具体案例,然后把分类或回归的算法一个个用在上面。
所以什么是Kaggle
就像国内阿里的天池大数据平台,Kaggle是国外领先的数据科学、机器学习竞赛平台,最近已经被Google收购。我们可以在上面下载数据集,应用我们机器学习的算法来找出结果,最后提交结果获得排名,如果你参加的是有报酬的竞赛,进入前几名还能获得报酬。最后你还能跟别人组队参赛,或者在网站上的Kernel里分享你的代码,和别人进行讨论。
如何注册Kaggle
- 进入Kaggle,网址是https://www.kaggle.com/
- 点击下面的Create an account
- 在弹出的窗口中,可以选择用Facebook、Google或Yahoo的账号注册,也可以点击Manually create a new account选择手动录入信息
- 输入一切信息后,你就有一个Kaggle账号了,以后kaggle.com/username(你刚刚输入的用户名)就是你的kaggle主页了
- 登录账号后,最上方的Competitions就是我们参加各种竞赛的地方;Datasets是下载所有数据集的页面,其中包括不是竞赛的数据集;Kernels是分享代码的页面,支持markdown。
- 等我们参加了竞赛有排名后,我们就能点击右上角的头像进入My Profile来看我们的排名。像我的页面就是https://www.kaggle.com/haochen1