面向地学应用的不确定数据聚类算法比较研究
【出 处】:
【作 者】:
蔡建南
;
邓敏
;
刘启亮
;
唐建波
;
黄金彩
【摘 要】不确定数据聚类分析已成为空间数据挖掘领域的一个研究热点。近年来,在传统划分与基于密度的聚类算法基础上,一系列不确定数据聚类算法相继被提出。虽然这些算法在地学领域的应用已经得到了广泛关注,然而其实际应用的有效性尚缺乏客观的评价。为此,选取当前具有代表性的6种算法进行实验对比分析。首先,设计40组包含预设模式的模拟数据进行测试。进而,采用亚洲气候数据集对6种方法识别气候区的能力进行比较分析,以Kppen-Geiger气候分类结果为基准对各种方法的实际应用效果进行评价。借助准确率和召回率对各种方法的聚类质量定量度量后,发现:1)对于同类型聚类算法,采用相对熵距离的算法聚类质量总体优于采用期望距离和模糊距离函数的算法;2)采用相对熵距离的划分算法聚类质量优于基于密度的算法,其中采用相对熵距离的KMedoids-KL算法的聚类质量最好。
上一篇:树状结构引导下的脊线层次划分方法研究
下一篇:空间数据溯源的概念、模型与服务