基于POI数据的房价影响因素实证分析

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:vicky 点击次数:125
论文字数:33202 论文编号:sb2021042612125935309 日期:2021-05-11 来源:硕博论文网
本文基于机器学习研究的用来预测缺失数据的格网单元房价的算法,对应的中位数绝对误差(MedAE)仅为 6291,即 1km*1km 的网格内房价预测的中位数绝对误差为 6291 元/m2,该结果较为理想,因为每个格网单元内涉及的影响因素有很多,例如房子户型、绿化情况等都有差异。

1 引言

1.1 研究背景及意义
近二三十年,中国经济发展速度迅猛,尤其是我国 1998 年结束福利分房体制的房地产行业,已成为我国国民经济的支柱性产业。2018 年房地产业占全国GDP 比重 6.65%,广东省房地产开发投资占省 GDP 比重 14.80%,广州市房地产开发投资占城市 GDP 比重 11.80%。
房地产兼具消费品和投资品属性,是一种特殊商品,而且作为资金密集型的产业,整个开发过程需要大量资金。可是,在房地产的迅速发展过程中,也引发了一些问题,例如房价涨幅过大、投资过热、价格过高等[1]。房地产行业的发展不仅会影响自身的平稳健康与否,单就整个经济环境中的节节相扣,与房地产紧密联系的相关产业就达几十种,如钢铁业、水泥业等相关原材料供给行业;再如水力、电力、燃气等能源供给行业;再如金融、运输等产业的配合[2]。2018 年 GDP增速为 6.6%,而房地产开发投资增速却高达 9.5%,相较之下,房地产业发展速度迅猛,其对经济的影响力不容小觑。
根据中国指数研究院发布的《2019 年 8 月百城新建住宅样本平均价格指数》,一线城市的房价远远高于其他城市,居于第一位的深圳房价是排名最后一位营口房价的 12 倍。影响房地产价格的因素一直以来都是热议话题,通过梳理北、上、广、深四城近年来经济报告与各类数据,可以看到城市的经济总量、流通货币总量、资金投入、人数、收入等都对房价产生了直接影响[2]。除此之外,城市的特点,如空间功能的差异、公共服务设施的配置等对房价也有着很大影响。
...................

1.2 研究内容
本章旨在分析空间功能视角下公共服务设施对广州市房价的影响,并通过建模,用 POI 数据预测缺失房价数据的格网单元的房价。先通过热点分析、空间自相关分析,探索广州市的高\低房价集聚区与空间分布格局。为了分析不同区域划分内公共服务对广州市房价影响的空间异质性,将研究区域分别划分为三个圈层与三个放射方向。通过地理探测器识别出不同空间内对广州房价具有显著影响的服务设施,然后探讨不同区域划分内,这些公共服务设施对房价影响的差异,再进一步解释公共服务对塑造广州市房价格局的影响。最后根据上文研究结果,通过建模,预测缺失房价数据但具备 POI 数据的格网单元的房价。
图 1.1 技术路线图
............................

2 文献综述

2.1 国内研究现状
POI 即 point of interest,泛指任何能够被抽象为点的地理实体,特别是商场、车站和学校等与生活密切相关的设施,POI 是电子地图的关键内容[17](2011)。
POI 遍布在城市的每个角落,是大数据时代的重要产物,海量的 POI 数据带来了深入研究城市的空间功能、结构与形态的可能性。POI 数据内容丰富,体现城市功能的能力与生俱来,它全面反映了人口、土地、经济和社会等主要城市要素的相互作用[18]。和传统的数据相比,其规模更大、覆盖范围更广、类别更多、更容易获取、更新速度更快。在调研中,发现大众对餐饮、生活设施、医院、学校、购物、银行、汽车服务等 POI 更为感兴趣,这些公共服务设施在日常生活中帮助人们减少了很多麻烦,很大程度上方便了人们的出行及日常生活[19](2012)。
近年来,POI 逐渐成为了研究城市的空间结构与城市形态的新方法,绝大部分都是中、微观尺度的应用[20](2017)。部分学者基于 POI 数据研究城市空间结构[21]、城市功能区识别[22]、城市边界提取[23]等,通过历史 POI 数据从宏观层面研究城市结构、商业结构的动态演变情况[24][25][26]。韩昊英等(2016)根据 POI 数据及公交刷卡数据,去识别城市的功能区[27]。孙宗耀等(2017)通过 POI 数据,分析了区内居住、工作、医疗及休闲等生活服务设施的空间分布状况[28]。配置优质完善的公共服务会带来劳动力、资本、产业的集聚[4]。赵宏波等(2018)基于 POI 数据对郑州市文化设施的区位布局特征与影响因素进行了研究[29]。范梦余等(2019)研究了游客地理 POI 的空间格局及游客在 POI之间的移动轨迹特征[30]。
.......................

2.2 国外研究现状
公共服务设施是城市管理的主要内容之一,更是城市生活的重要支撑和保障[3]。公共服务在城市内部的不同空间也有所差异,而不仅仅是在城市与城乡之间[3][5]。这些差异会导致城市的某个区域空间具有更多优势,例如能够吸引更多劳动力、资金、技术等,这又进一步加深城市内部不同区域的空间功能差异。
Long 等人[36][37](2013)提出将道路网络与 POI 分类结合起来,得到基于 POI的人口数据空间化合成方法等(2015)。部分学者基于 POI 数据研究城市边界提取[38]、城市人口时空变化[39]等。
房价是土地空间价值的重要体现,高房价通常集中于市中心、繁华区域或公共服务设施配置完善的区域,人们在选择住宅的时候,也会更倾向于选择公共服务更完善、空间功能更优越的地方,以获得更优质的就业、教育机会和更完善的医疗、生活服务[6][7]。空间距离是公共服务可使用性的重要影响因素,即可达性对房价具有显著影响,因此其规划和布局被资本化于房价中,构成了住宅资本价值的一部分[8]。在所有公共服务类型中,教育、交通、商业、休闲娱乐、安全防护、环境等对房价都有显著影响[13][14][15]。
Geodetector(也称为地理探测器)是 2010 年后兴起的,用以识别环境危害因子的分析方法,它的核心思想基于假设:若某环境自变量对某因变量具有重要影响,则该因变量与自变量的空间分布应具备相似性[40]。空间分层异质性(Spatial stratified heterogeneity ,缩写 SSH)是指多个类型或多个区域之间互不相同,可用地理探测器 q-statistic 来检验[41]。其基本思想是:将研究区分为几个子区域,假若该区域的总方差大于子区域的方差之和,则存在空间差异;若两个变量的空间分布趋于相同,则它们之间具有统计关联性[42][43]。由于Geodetecto 分析中使用的自变量为离散型变量,需要将连续型变量进行适当的离散化[44][44]。
.........................

3 研究数据与研究方法........................ 10
3.1 研究数据........................... 10
3.1.1 研究区域概况........................... 10
3.1.2 数据来源、说明及处理 ....................... 11
4 基于 POI 数据研究公共服务对房价影响的实证分析............................. 24
4.1 研究设计................................. 24
4.2 广州市房价空间格局............................... 25
5 基于 POI 数据进行房价预测研究......................... 40
5.1 研究设计............................ 40
5.2 数据的选取与处理...................... 41

5 基于 POI 数据进行房价预测研究

5.1 研究设计
在本文所设计的格网单元中,只有 2456 个格网单元具备房价数据,而具备POI 数据的格网单元数为 5726 个。针对该情况,本章将基于机器学习研究一种算法,用来预测缺失数据的格网单元的房价。主要步骤如下:
(1)获取 POI 数据及房价数据,并对其进行特征工程,作为学习样本。
(2)设定基模型,在这里选取 Lasso Regression、Ridge Regression、Elastic Net Regression、随机森林、GBoost、XGBoost 和 LightGBM 等 7 个算法。
(3)通过贝叶斯优化(Bayesian Optimization)进行超参数搜索,以此确定随机森林、GBoost、XGBoost 和 LightGBM 等算法的较优的超参数组合。
(4)用 POI 数据及房价数据对设定好超参数的基模型进行训练,以确定各基模型的参数。
(5)模型集成,通过 Stacked Generalization (SG)将 Lasso 回归、Ridge回归等多个模型的输出集成起来,得到完整的 Stacking 模型,下文中简称为SG_models。
(6)对模型的预测效果进行评测,选取效果最理想的模型,实现缺失数据的格网单元的房价预测。
图 3.1 研究区域概况图
....................

6. 论文总结及展望

6.1 应用与结论
本文通过广州市 2019 年 5、6、7 月商品住宅数据(所采用的房价数据包括在售楼盘、二手房等商品住宅的销售价格,且剔除了写字楼和商铺地产的数据),分析广州市房价的空间分布情况。
研究发现,广州市房价在 4149 元/m2至 66458 元/m2的范围内浮动,平均房价为 22275 元/m2。广州市房价从核心城区(越秀、荔湾、海珠、天河)沿交通主干线向周边城区递减,整体上呈单中心圈层加放射状空间结构。
广州市房价在圈层加放射格局下,显示出中心高周边低,南高北低的总体特征。热点分析显示,广州市房价同时存在高房价(热点)聚集与低房价(冷点)聚集。高房价聚集区 p 0.05 主要集中在市中心,从核心城区向南蔓延至番禺区,这些区域汇集了广州市绝大部分高端楼盘。与此同时,广州市的低房价聚集区多位于各个周边城区,尤其是北边的花都区,形成低房价连绵区。
广州市房价数据出现明显的集聚特征,且具有正的空间自相关。通过空间自相关分析,发现核心城区、中心城区及周边城区之间的房价聚集分布存在显著差异。在核心城区中,房价空间分布数值高的单元趋向于被相邻的高房价单元所包围;而在房价较低的周边城区,表现为房价空间分布低的单元的空间聚集特征。在各圈层、各放射方向,对广州市房价具有显著影响力度的公共服务并不相同。
在不同圈层划分中,第一圈层的公共服务因子对房价的影响力度显著强于第二、第三圈层,以科教文化服务、金融保险服务和体育休闲服务为主,而城市尺度上各因子影响力度与第一圈层基本持平。在不同的放射方向,南部城区的公共服务因子对房价的影响力度高于其它放射方向,但城市尺度上各因子影响力度均大于三个放射方向。
参考文献(略)

上一篇:行政审批改革与企业市场势力——来自地级市设立行政审批中心的经验证据
下一篇:国家森林城市建设对大气污染的影响——以长三角为例