中国房地产经济区划的聚类分析论文
本文共计3756个字,预计阅读时长13分钟。【 字体:大 中 小 】
中国房地产经济区划的聚类分析论文
1数据来源、指标体系及研究方法
1.1数据来源
本文研究的时期为1999-2003年,一共5年,分年度对我国的房地产发展的经济区划进行考察,研究对象包括中国30个省市地区,其原始数据全部来源于《2000-2004年中国统计年鉴》
1.2指标体系
在对原始数据进行筛选综合的基础上我们构造了11项基本指标:
选择以上指标主要基于以下理由:①构造指标的原始数据能在历年统计年鉴中找到并规范使用。②指标能反映出房地产经济发展的各方面,综合后能反映各省市地区房地产整体发展状况。③原始数据均取自统计年鉴,数据在时间上具有较好的前后一致性,各年度的横截面数据也具有较好的可比性。
2003年的实证研究这一部分,我们将具体介绍2003年度的研究步骤和结果。
2.1全国30个省市地区指标值分布的初步比较
86统计与决策2006年2月下)
将全国30个省市地区的原始数据进行初步处理,统计出各项指标的期望、标准差和变异系数如表2。
观察表2所示的11个指标的变异系数,我们发现本年完成投资、资金来源总计、房地产开发经营总收入、这三个指标的标准差系数均超过了100/,房地产开发营业利润甚至达到246.16%,除个人购买商品房住宅比重、房屋建筑面积竣工率这两个比例指标相对来说稍微小之外,其余的指标都超过了50%,这表明我国的房地产业地区之间的发展存在巨大的不平衡,地区之间存在极大的差异。而极差系数则把这种差异性表现得更为明显,并且它还进一步表明我国房地产业的发展不但区域发展不平衡,而且发展最快的地区与最落后的地区落差非常大。这些情况表明对这30个省市地区进行房地产发展水平区划非常必要。
下面我们采用聚类分析中的系统聚类法对这30个省市地区进行房地产发展水平区划。
2.2聚类分析过程2.2.1聚类分析原理
聚类分析是研究样品或指标分类问题的一种多元统计方法,系统聚类法是聚类分析中应用最为广泛的一种方法,它的基本原理是:首先将一定数量的样品或指标各自看成一类,然后根据样品或指标)的亲疏程度,将亲疏程度最高的两类进行合并,重复这一过程,直至将所有的样品或指标)
合并为一类。
我们采用g型聚类分析紂样品分类),在聚类之前先对数据进行标准化处理以消除数据间存在的量纲和数量级的差别。为了将样品进行分类,将一个样品看作p维空间的一个点,并在空间定义距离,距离越近的点归为一类,距离较远的点归为不同的类。
本文计算样品之间的距离采用欧氏距离:
再运用系统聚类法中的Word法离差平方和法)进行分析,Word法的基本原理见相关文献,不再赘述。
2.2.2数据处理及结论
我们采用SPSS统计软件进行数据处理,得到房地产业发展水平经济区划的聚类图谱如图1。
根据聚类图,我们看到有四个聚集比较密集的区域:号到11号为第一个聚集区;2号到16号为第二个聚集区;7号到24号为第三个聚集区;25号到30号为第四个聚集区。其中第二个聚集区又与第三个聚集区联系较紧,第四个聚集区与其余三个聚集区距离最远。结合各个聚集区指标值我们将这30个省市地区作如下划分:
1)房地产经济发达区:上海、广东、北京、江苏、山东、浙江。这些省市主要分布在东部沿
2)地产经济发达区开始有了较大差距,但还是基本处于靠前的位置。
3)陕西、河南、海南。这些省市主要分布在我国中西部,没有地理位置优势,经济发展比较缓慢,房地产业发展也受到限$|J。从各项指标来看除个人购买商品房住宅面积比重比较高以外其余各项指标均处于中下游位置。
4)房地产经济较落后区:安黴、江西、湖南、河北、黑龙江、山西、青海、内蒙古、宁夏、吉林、新疆。这些省市地区也大多分布在我国中西部地区,房地产业发展受制于当地经济条件和经济环境的影响发展也比较缓慢,从各项指标情况来看,除房屋建筑面积竣工率最高外,其他指标基本都处于下游水平。
