房价跟 CBD 距离关系的空间异质性,适合想研究空间数据分布规律的你。可塑性面积单元问题是重点,换句话说,不同的分区方式、尺度大小,会影响结果。这套背后的核心就是你得考虑空间单位对的干扰,嗯,不然偏差大。
尺度效应讲的就是你把小区合并成街道再,得出的完全变样。划区效应则是在说,就算区域大小不变,你怎么划分区域,也能影响结果。对于做空间回归、地理加权回归这些的朋友来说,这可不是什么细节问题,是核心变量啊。
如果你用的是 ArcGIS 或 GeoDa 之类的工具,那些聚合操作、邻接矩阵都得好好设定,别一键默认。别说,我自己踩过坑,不换区域划分,房价的回归系数就是不显著,一换就蹦出来了。所以啊,别偷懒,多试几个分区方案。
想深挖的,可以看看这篇文章的原始版本:CBD 距离与房屋价格的空间异质性,里面还有实际案例和代码示范,蛮值得参考的。
对了,如果你对空间比较熟,顺手看看这篇关于 XLSX 归一化 的 Matlab 实现,也挺实用的,尤其是你数据前那一块还不顺手的话。
,如果你想搞明白“为什么结果总飘”,不妨先从可塑性面积单元问题下手。要是你用的是像 spdep
或 PySAL
这样的库,那就更要小心划区问题,数据一变,模型参数也跟着变。