数据竞赛/Two Sigma Connect Rental Listing Inquiries
赛题描述
本文介绍的是 Kaggle 比赛:Two Sigma Connect: Rental Listing Inquiries
。赛题要求是根据 RentHop 租房网站上的房屋的信息,预测受欢迎的程度,受欢迎的程度有 3 种:'high'、'medium'、 'low',因此可以看作是 3 分类的问题。
数据主要包括房屋的房间数量、洗手间数量、创建时间、价格、位置、房屋的照片、经纬度、街道、中介,以及一段文本介绍。
这道赛题数据量不大,但同时包含了结构化数据、文本数据和图像数据,因此非常适合用于入门学习。
本文主要针对这些数据,展开数据探索的流程。