1基于网格的聚类方法研究
基于网格的聚类方法研究
【摘要】由于已有的聚类算法对于发现任意形状的聚类和处理离群点效果不理想,分析了现有基于网格的聚类算法。使用网格方法的数据分析方法将空间划分为由(超)矩形网格单元组成的网格,然后在网格单元上进行聚类,最后提出基于网格的聚类需要进一步研究的方向。
【关键词】数据挖掘;网格;聚类
1 引言
数据挖掘指从大型数据库或数据仓库中提取隐含的、未知的及有应用价值的信息或模式。它是数据库研究中的一个很有应用价值的领域,融合了数据库、机器学习、统计学等多个领域的理论和技术。
数据挖掘中广为研究的课题之一是聚类分析,从数据中寻找数据间的相似性,并依此对数据进行分类,从而发现数据中隐含的有用信息或知识。目前已经提出了不少著名的数据聚类算法,有CLARANS 、BIRCH 、DBSCAN 和CLIQUE 等。但对于高维、大规模数据库的高效聚类分析仍然是一个有待研究的开放问题。
空间数据处理中常用的将空间数据离散化的方法是网格方法。由于易于增量实现和进行高维数据处理而广泛应用聚类算法。研究人员已经提出了很多基于网格的聚类算法,包括利用了存储在网格单元中的统计信息的STING ;用一种小波转换方法来聚类数据对象的WaveCluster ;在高维数据空间中基于网格和密度的聚类方的CLIQUE 法等。
本文分析了从网格的表示,划分网格单元的方法,到统计网格内信息,搜索近邻网格单元,聚类超过指定阙值的网格单元的各个步骤,对已有的基于网格的聚类算法进行了研究,最后展望了基于网格方法聚类的研究方向。
2 网格的定义与划分
网格的基本概念,设A1,A2,…,Ar 是数据集O={O1,O2,…,On}中数据对象的r 个属性的有界定义域,那W=A1×A2×…×Ar 就是一个r 维空间,将A1,A2,…,Ar 看成是W 的维(属性、字段),则对于一个包含n 个数据点的r 维空间中的数据集O={O1,O2,…,On},其中Oi={Oi1,Oi2,…,Oir}(i=1,2,…,n ),Oi 的第j 个分量Oij ∈Aj 。将W 的每一维M 等分,即把W 分割成个网格单元。
基于网格聚类算法的第一步是划分网格结构,按搜索子空间的策略不同,主要有两种算法:一种基于由底向上网格划分方法的算法,另一种是基于自顶向下网格划分方法的。
相关文章
- 基于遗传算法的松质骨支架孔隙空间分布控制
- 供电企业社区经理网格化服务管理研究-成果推广报告
- 基于有限差分法的微分方程离散化求解
- 一种CFDCSD耦合计算方法
- 3DMAX修改器类型
- 网格应用研究现状
- 基于遗传算法的网格资源调度算法
- 室内自主移动机器人定位方法研究综述
- 城市网格化信息管理解决方案(草稿)
- 毕业设计虚拟校园三维模型设计制作
第2*卷 第*期 201*年*月 计算机辅助设计与图形学学报 Journal of Computer-Aided Design & Computer Graphics Vol. 2* No.* ***. 201* 基于遗传算法的松质 ...
供电企业社区经理网格化服务管理研究 推广总结 社区经理网格化服务+互联网实践 国网国网上海市电力公司营销部 2014年上海市电力公司营销部管理创新项目供电企业社区 经理网格化服务获得国网公司重大管理创新示范项目三等奖, 2015年上海市电力 ...
基于有限差分法的微分方程离散化求解 [摘要] 目前偏微分方程数值求解的方法主要有两种,即有限差分法和有限元方法.本文论述了基于有限差分法的微分方程求解,离散化过程,并对结果进行了分析. [关键词] 有限差分法 离散化 数值模拟 1. 前言 ...
第27卷 8006正 第1期 1月 航空学报 ACTAAERoNAUTICAET VoI_27No.1Jan. 2006 ASTR()NAUTICASINICA 文章编号:10006893(2006)01-0033-05 一种CFD/CSD ...
3DMAX修改器类型(对象空间修改器) 对象空间修改器直接影响局部空间中对象的几何体. 应用对象空间修改器时,使用中的其他对象空间修改器,对象空间修改器直接显示在对象的上方.堆栈中显示修改器的顺序可以影响结果几何体. 本节内容 影响区域 ...
网 格 应 用 研 究 现 状 清华大学计算机系高性能所网格研究组 刘 鹏 [email protected] http://www.gridhome.com 按照Ian Foster 和Globus 项目组的观点,网格应用领域目前主要有四类 ...
第41卷第12期2004年12月 计算机研究与发展 JOURNAL OF COM PUTER RESEARCH AND DEVELOPM EN T V ol . 41, No . 12Dec . 2004 基于遗传算法的网格资源调度算法 林 ...
第 卷第 期 年 月 机器人 × ∂ √ 文章编号 2 2 2 室内自主移动机器人定位方法研究综述 李群明 熊蓉 褚健 浙江大学工业控制技术国家重点实验室 浙江杭州 Ξ 摘 要 定位是确定机器人在其作业环境中所处位置的过程 应用传感器感知信 ...
"无线青岛"城市网格化信息管理 解决方案 青岛艾维通信有限公司 二OO 九年十二月 目 录 第二章 概述 ......................................................... ...
目录 摘要 „„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„2 前言 „„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„„4 1. 论文的选题背景与研究意义 „„„„„„„„„„„„„„„„„„„„„5 1.1选 ...