空间数据的自相关性带来的“坑”,还真得好好聊聊。你以为随便采样就能搞定空间数据?嗯,不好意思,还真不是这么回事。空间数据挖掘就得讲究点方式,像那种传统的随机采样,用在这儿完全没效果。还得用专门的算法才行,是大数据集那种,效率也要考虑进去。
能直接把挖掘技术嵌到SQL
里,这点我觉得挺香的,省去了中间的麻烦。比如查询的时候,顺手做个模式识别,响应也快,数据也能实时,挺适合做一体化的数据服务。
你要是第一次接触空间数据库,可以先看看《详述空间数据库》,里面讲得还蛮清楚;如果你已经开始动手做项目了,像《空间数据挖掘综述》和《Oracle 空间数据库配置》这类文章也别错过,实用性比较高。
还有个提醒:空间数据库的结构一般都比较复杂,不是一般的二维表就能搞定,是带方向性或者拓扑关系的数据时,记得用对工具和方法,不然容易绕晕自己。
如果你刚好在做 GIS 相关项目,或者想优化大体量数据查询效率,可以试试把空间挖掘技术和 SQL 结合起来,效果比你预期的还好。