项目背景

在万物互联的趋势下,每天会有大量的信息被记录,从而产生庞大的数据信息。对这些数据充分的挖掘和分析,可以得出许多非常有价值的信息,并可以成为大多数企业业务增长、迭代更新的关键。在数据分析行业发展成熟的国家和行业,90%的市场决策和经营决策都是通过对数据分析研究而确定的。用数据说话,重视定量分析,也逐渐成为科学研究、企业经营、政府决策等过程着重考虑的问题。数据分析工作已经成为进行决策和做出工作决定之前的重要环节,可以将它应用于经济发展的各个领域当中。本项目以房产数据分析进行介绍,包括数据采集、数据清洗和处理、数据分析和数据可视化等环节。

项目价值

房产数据具有其鲜明的特性,在采集房产数据前,首先应该明确确定影响房子价格的因素有哪些。本项目选择与房产价格关系较紧密的房屋本身属性、房屋的空间地理位置、周边的其他设施,例如户型、区位、交通、价格、品牌、配套设施等。这些数据可以借助爬虫技术从房源网站进行爬取,例如价格、面积、户型、位置经纬度等字段。

images-img1.png