作 者:数字567
作者简介:作者本人是CDA数据科学家,同时也是宁波校区的副校长
文章从数据爬取、数据清洗、文本分析、建模、模型解释等流程详细介绍了房价数据分析的流程和技巧,模型最终的可解释性达到了0.75,并交代如何对关键特征进行解释。
房价一直以来是全国老百姓热议的话题,总结起来,无论对于刚需者还是投资者,无非关注两方面的问题:(1)房价的发展趋势是跌还是涨?这就需要对房价的时间发展趋势进行分析预判。(2)哪个区域的房子更具投资价值?这个问题可以理解为某个时间节点下的数据挖掘问题。本文探索和回答的是第二个问题,围绕这个目标567做了一件很多人喜闻乐见的事,展示了如何利用爬虫数据进行数据分析的全流程。
需要说明的是,虽然大部分人对于房价的影响因素都有所了解,但是哪些因素是关键的?关键因素对于房价的作用到底是如何促进和抑制的?像这类问题是大部人没法回答的,这也就体现了数据分析的价值所在。因此,本文将回答两方面的问题:(1)影响房价高低的因素中哪些是关键的;(2)这些关键因素是如何体现制约和限制作用的。
原文详情请移步:https://mp.weixin.qq.com/s/IeR8KLnTrUKSYuDMzWOdMg
作者简介:作者本人是CDA数据科学家,同时也是宁波校区的副校长
文章从数据爬取、数据清洗、文本分析、建模、模型解释等流程详细介绍了房价数据分析的流程和技巧,模型最终的可解释性达到了0.75,并交代如何对关键特征进行解释。
房价一直以来是全国老百姓热议的话题,总结起来,无论对于刚需者还是投资者,无非关注两方面的问题:(1)房价的发展趋势是跌还是涨?这就需要对房价的时间发展趋势进行分析预判。(2)哪个区域的房子更具投资价值?这个问题可以理解为某个时间节点下的数据挖掘问题。本文探索和回答的是第二个问题,围绕这个目标567做了一件很多人喜闻乐见的事,展示了如何利用爬虫数据进行数据分析的全流程。
需要说明的是,虽然大部分人对于房价的影响因素都有所了解,但是哪些因素是关键的?关键因素对于房价的作用到底是如何促进和抑制的?像这类问题是大部人没法回答的,这也就体现了数据分析的价值所在。因此,本文将回答两方面的问题:(1)影响房价高低的因素中哪些是关键的;(2)这些关键因素是如何体现制约和限制作用的。
原文详情请移步:https://mp.weixin.qq.com/s/IeR8KLnTrUKSYuDMzWOdMg