1. Competitions组成
Competitions包括Featured, Research, Recruitment, Getting Started, Playground等几种的类型。其中Featured和Research是以奖金的形式进行竞赛,Recruitment, Getting Started, Playground是用来学习的。在自己的主页可以看到自己的得奖情况。
2. 经典学习题之Titanic
kaggle上有个很经典的学习题是Titanic: Machine Learning from Disaster(泰坦尼克号:来自灾难的机器学习)。这是一道练习题,属于Knowledge的范围。感兴趣的同学可以上来练练手,哪怕你是刚出门的同学,也没关系。因为上面有很多竞赛者已经做过了这道题,有大量的开源代码。而且kaggle也提倡学习者使用”Fork Script”或者“Fork Notebook”功能,直接在已有的代码基础上进行修改,帮助更加高效学习。哈哈,我知道,大家看到这里,肯定还是一头雾水。好了,接下来,让我用图示来讲解一下吧。
(1)点击“Titanic: Machine Learning from Disaster”,将会进入这样的界面。你可以用Excel,Python,R & Random Forests来预测这次灾难事件中的幸存率。然后,竞赛题的发布方会较为详细地描述题目的背景、要求等内容。
(2)然后可以看到“Code Sharing With Kaggle Kernels”,这里面包含了上述四类方法的优秀的开源代码。如果你更加喜欢Python,那就点击“A journey Through Titanic”。
(3)以“A journey Through Titanic”为例说明。
第一步,点击“Fork Script”或“Fork Notebook”
第二步,对复制的代码根据自己的想法进行修改
第三步,点击运行按钮“Run”
第四步,点击退出编辑按钮“Exit Editor”,查看生成的csv文件
第五步,点击提交按钮“Submit to Titanic”
3. 竞赛实战题之Bosch
(1)选择自己感兴趣的竞赛题目“Bosch Production Line Performance”,这道题的奖金是3万美金,目前有1101支队伍参加。
(2)进入页面之后,可以看到更加详细的竞赛题目的描述。这类题是一些企业想要解决自身面临的一些实际生产问题,然后发布在Kaggle上,希望全球的数据科学家可以帮助他们解决。
(3)竞赛详情→获取数据→提交
That is all,我想,聪明的你,看到这里,应该对Kaggle的Competitions部分已经有了较为清晰的了解了。好了,今天的内容就这些了,感兴趣的同学赶紧到Kaggle上去练手吧。如果你有好的建议,记得给我们留言哦。也希望更多的同学给我们投稿(wangyongjie@datageekers.com),我们会以你的名义发布,让我们一起建设一个多姿多彩的数据科学交流社区,让更多的后来者受益,谢谢!