这篇文章来自Kaggle上的一位数据科学家,为New York City Taxi Trip Duration(纽约的士路程所花时间预测)项目写的一篇从分析到代码全部囊括在内的解答文章。原文 An MVP Aproach 1. 简介 作为一名(公认犯懒)的数据科学家,我喜欢使用最简单的方式来处理数据。Google是我最好的朋友。除了极少数事之外,几乎没有什么是不能通过一次简单的搜索解决的。 这个kernel使用IPython Notebook编写,使用XGBoost开发,目标是实现让读者看完后就能立刻提交结果(将结果提交后Kaggle会打分并进行排名)。这意味着任何读者都运行代码块、提交结果,并且获得高分。当然,如果你的目标是前10%的话,