空间数据挖掘技术中的划区效应及在矿山中的应用

阅读: 评论:0

 第32卷第8期煤  炭  学  报Vol.32 No.8  2007年8月JOURNAL OF CH I N A COAL S OC I ETY Aug. 2007 
  文章编号:0253-9993(2007)08-0804-04
空间数据挖掘技术中的划区效应及在
矿山中的应用
孙庆先1,方 涛2,郭达志3,杨可明3
(11中国水利水电科学研究院遥感应用中心,北京 100044;21上海交通大学图像处理与模式识别研究所,上海 200240;31中国矿业大学(北京)资源与安全工程学院,北京 100083)
摘 要:以某煤矿煤层厚度为实验对象,采用模糊聚类(Fuzzy C-Means,FC M)处理技术,研究并证实了空间数据挖掘中的划区效应现象.
关键词:空间数据挖掘;划区效应;可塑性面积单元问题(MAUP);模糊聚类
中图分类号:P208   文献标识码:A
Zon i n g effect i n spa ti a l da t a m i n i n g and its appli ca ti on i n coa l m i n e
S UN Q ing2xian1,F ANG Tao2,G UO Da2zhi3,Y ANG Ke2m ing3
(11Re m ote Sensing Application Center,China Institute of W ater Resources and Hydropo w er R esearch,B eijing 100044,China;21Institute of I m age P ro2 cessing&Pattern R ecognition,Shanghai J iaotong U niversity,Shanghai 200240,China;31School of Resource and Safety Engineering,China U niversi2 ty of M ining and Technology(B eijing),B eijing 100083,China)
Abstract:Taking the thickness of coal sea m s in a coal m ine as the experi m ent case,studied and confir med z oning effect in s patial data m ining by adop ting Fuzzy C-Means(fuzzy clustering)f or the investigati on of z oning effect in s patial data m ining.江苏健康网
Key words:s patial data m ining;z oning effect;modifiable area unit p r oble m(MAUP);fuzzy clustering
  在地学研究中,许多空间数据,如遥感数据、土地利用数据、野外调查资料是与面积相联系的.在取样或分析这些空间数据时,把研究空间按某一基本面积单元划分可以有许多种方法,由此产生了面积单元的选择问题,即出现了分析结果随面积单元(栅格细胞或粒度)定义的不同而变化的问题,这就是可塑性面积单元问题(Modifiable A rea Unit Pr oble m,MAUP).因此,空间分析结果的可靠性和精度与
数据中的基本面积单元的性质和涵义关系密切,这是由资料收集和分析所基于的面积单元的敏感性所致.可塑性面积单元问题包括2个方面,即尺度效应(Scale Effect)和划区效应(Z oning Effect).尺度效应是指当空间数据经聚合而改变其粒度或栅格细胞大小时,分析结果也随之变化的现象;划区效应则指在同一粒度或聚合水平上由于不同聚合方式(如划区大小、方向和形状不同)而引起的分析结果的变化[1].两类效应实质上都是由于基本面积单元划分方式不同而引起的,因此,划区效应可被认为是尺度效应的一种形式.
李志林[2]系统地探讨了空间数据处理中的尺度问题,给出了空间数据处理的尺度理论,引入了尺度谱等新概念.领域专家们出版了数本专辑讨论研究尺度问题,如Goodchild等著的《遥感与地理信息系统中的尺度问题》(1997年),Tate等著的《地理信息科学中的尺度问题》(2001年),Sheppard等著的
收稿日期:2006-10-24  责任编辑:耿红敏
  基金项目:国家自然科学基金资助项目(60275021)
  作者简介:孙庆先(1968-),男,河北廊坊人,博士后.E-mail:6886sun@1631com
第8期孙庆先等:空间数据挖掘技术中的划区效应及在矿山中的应用《尺度与地学调查》(2004年).可见,空间数据处理的尺度问题十分重要,受到了越来越多的关注.
空间数据挖掘(Spatial Data M ining,S DM )是从空间数据库中提取隐含的、用户感兴趣的、潜在有用
的空间的和非空间的模式和普遍特征的过程[3~5]
.它的研究对象是由空间实体组成的空间数据库.空间实体除具有事物型数据的属性特征外,还具有位置特征、几何特征和尺度特征.空间数据挖掘是数据挖掘技术发展到一定阶段,研究对象不断复杂化的必然结果,也是适应近年来“3S (GI S,RS,GPS )”技术迅
猛发展和应用领域不断扩大的必然产物[3]
.空间数据挖掘作为一个新的研究领域日益受到重视,但其中的尺度问题却无人问津.空间数据挖掘处理对象的特点决定了挖掘出的知识同样不可避免地存在尺度问题.
1 研究的基本思路、
对象概况和研究方法
图1 第1~3层煤层厚度分布
Fig 11 Thickness distributi on in coal sea m 1~3111 研究的基本思路
以某煤矿煤层厚度为研究对象.首先,在同一尺度上采用不同的方案划分矿体,分别构建数据库,作为数据挖掘的数据源;然后,对这些数据库使用相同的挖掘技术(本文采用模糊聚类技术)进行挖掘;最后,比较分析挖掘结果,得出结论.112 研究对象概况
某煤矿矿界面积约11km 2
,含煤地层中有3个可采煤层,矿界内布置有勘探钻孔78个.根据钻孔资料提供的煤层厚度,使用普通克里金(O rdina 2ry Kriging )插值法(插值过程和具体插值参数省略),生成煤层厚度分布(图1).
113 研究方法
(1)划区方案 划区效应是在同一基本面积单元(粒度或栅格)条件下由于聚合方式的改变
而引起分析结果的变化.因此,首先要确定基本面积单元的大小.本研究中,采煤工作面即基本面积单元.根据已回采结束的工作面的实际数据,本文
确定基本面积单元为40000m 2
.具体的划区方案是,将3个可采煤层厚度分布按如图2所示的划区方案,每一划区方案各执行一次挖掘过程.
(2)挖掘技术的选择 各个煤层厚度分布情况
以及煤层间厚度分布关系是开采难易程度的依据之
一,为使工作面正常衔接以保持矿井长期稳产高产,开采时应遵循难易结合的开采顺序.本文从生
产实际需要出发,将3个可采煤层间的厚度关系分为3类.聚类是数据挖掘中常用的技术方法,一些文献介绍了诸多聚类算法,而且新的算法不断出现.算法的选择取决于数据的类型、聚类的目的和应用.在应用实践中,大多数研究对象没有严格的类属和性态,具有中介性的特点,模糊聚类正好适合描述这种中介
性,因此成为当今研究聚类分析的主流[6,7]
.模糊C -均值聚类算法(Fuzzy C -Means,FC M ),即I S O 2DAT A ,是由Bezdek J C 和Dunn J C 提出来的.模糊C -均值算法的优点是,可伸缩性好,适合高维数据,
对数据输入顺序不敏感,算法效率较高
[8,9]
.基于本研究的数据特点和应用目的以及模糊C -均值算法的
5
08
煤  炭  学  报
2007年第32
图2 划区方案
Fig 12 Several zoning p r ojects
(a )200m ×200m 南-北向划区方案;(b )100m ×400m 南-北向划区方案;
(c )400m ×100m 南-北向划区方案;(d )200m ×200m 东南-西北(东北-西南)向划区方案
表1 格网及其煤层厚度记录格式
Table 1 For ma t of cell and th i ckness i n coa l seam s m 
格网编号
第1层煤厚度
第2层煤厚度
第3层煤厚度
1
5105
1145
1159
25195113511643516011551173
江苏警官学院学报…………优点,在数据挖掘中采用模糊C -均值算法.
(3)数据库的构建 每个格网及格网所在的3个煤层的厚度构成一个记录,则由全部格网及
其3个煤层厚度值构成关系型数据库,供数据挖
掘之用.数据库的格式见表1,以1txt 格式保
存,可直接为本文所采用的挖掘算法所接受.对
面积不足40000m 2
的单个格网仍按一个格网记
录.因煤层厚度是连续变化的数值,一个格网中很可能存在多个煤层厚度值可供选择,本研究采用面积占优法计算格网煤层厚度值,即格网中所占面积最大的煤层厚度值记为该格网的煤层厚度值.
2 数据挖掘结果与分析
聚类分析是根据数据的不同特征,将其划分为不同的类别.目的是使属于同一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大.聚类的结果可作为判别类别的一种指标.为了论证空间数据挖掘中是否存在划区效应现象,需要用尽可能多的指标来证实由于划区方案的变化而造成的挖掘结果的变化.为此,除计算由于划区方案变化而造成类别标志(各类别中心作为该类别标志)变化外,也计算了由于划区方案变化而造成的各种类别的格网在全部格网中所占比例的变化情况,其结果见表2.
表2 空间数据挖掘的划区效应
Table 2 Zon i n g effect of spa ti a l da t a m i n i n g
类别及其指标   
200m ×200m
南-北向
100m ×400m
陕西中医学院图书馆南-北向
400m ×100m
南-北向
200m ×200m
东南-西北向
格网占全部格网的比例/%4317451140194419第1层
4118050412077741213684118732第1类
中心第2层
1116466111619011166441116363第3层1119846112194011198231120417格网占全部格网的比例/%
3618331738113614第1层
5113259511690551150065117414第2类
中心第2层
1127544112810311274191128193第3层1136874113753911371351137334格网占全部格网的比例/%
1915211221101817第1层
5166215516688051678675169074第3类
中心第2层
1130149112933511304141129639第3层
1139850
1139215
1140538
1139659
  由表2可见,每行数字为不同划区方案的对比指标.可以看出,挖掘结果因划区方案的不同而发生了
6
08
708第8期孙庆先等:空间数据挖掘技术中的划区效应及在矿山中的应用
变化,即空间数据挖掘存在着划区效应现象.例如,在第2类中,100m×400m南-北向和400m×100m南-北向两种划区方案的格网数相差414%,折合面积约为484000m2,这对布置工作面位置和回采方向具有重要的参考价值.再如,在第2类中,第1层煤的中心厚度发生了较大变化,200m×200m 南-北向和200m×200m东南-西北向两种划区方案变化为0104m,这对采区主要巷道是采用煤层联合布置,还是逐个煤层单独布置提供了重要的参考信息,采区主要巷道的布置方式影响着采区的回风、出煤、运输系统是否简洁畅通,也影响采区工作面的布置方式,甚至对整个矿井的开采方式也有一定的影响.为提高煤炭采出率,减少浪费,延长矿井寿命,应当合理布局,采取肥瘦搭配、难易结合的开采方针,从长远利益出发,通盘考虑.聚类挖掘的结果是重要的科学依据,有很大的参考价值.
  煤矿采掘巷道布置方式的选择是煤矿生产中最重要的内容,同时又是技术性非常强的工作,需要考虑的因素众多,主要是地质构造、煤层赋存状态、煤层及其顶底板岩石性质、煤层间距、煤层厚度及
变化规律等,这些因素往往交织在一起,需要综合考虑,权衡利弊,在保证安全的前提下尽量减少巷道的掘进量,以降低成本,提高效益.在各种因素之中,煤层整体地质构造、煤层赋存状态等变化较慢,且在勘察阶段就已从整体上掌握控制,而煤层厚度受多种随机因素的影响,其分布相对复杂,变化较快,是最难控制的因素之一.
对非均匀分布的煤层厚度进行聚合,面积单元的任意性导致了聚合分析的结果发生变化,也就是说,聚合分析的结果依赖于面积单元的划分方式.划区效应在任意大小的面积单元上都可能出现,但划区效应现象的明显程度与数据的均匀性有关,均匀程度高,现象不明显,均匀程度低,现象就会十分明显.即划区效应取决于数据的均匀性.
3 结  语
根据空间数据的特点,参考地学领域其它学科的研究思路,将多尺度分析的技术思想引入空间数据挖掘研究之中.在最常见的长壁法采煤工作面布置方向的选择上,有走向长壁、倾斜长壁和伪倾斜长壁3种基本方式可供选择和互相搭配,工作面长度和宽度的选择也存在一定的任意性.也就是说,存在着基本面积单元划分方式的问题.因此,在数据聚合时,划区效应现象就有可能出现.本文的技术思路对短壁法、房柱式及多种采煤方式的组合同样适用.采煤工作面的布置方式得到的结果只代表这种布置方式的信息,往往是片面的、不完全的信息,“窥一斑以见全豹”的做法是不可靠的.为降低巷道的掘进量,在
ais巷道布置时要充分考虑划区效应的影响,从各个煤层厚度相对分布情况的角度出发为矿井巷道布置方式提供参考信息.
参考文献:
[1] 邬建国.景观生态学———格局、过程、尺度与等级[M].北京:高等教育出版社,2000.给汶川小朋友的一封信
[2] 李志林.地理空间数据处理的尺度理论[J].地理信息世界,2005,3(2):1~5.
[3] 邸凯昌.空间数据挖掘与知识发现[M].武汉:武汉大学出版社,2001.碘甘油
[4] Ah med Es mat Sabry.S patial data m ining model f or satellite i m age ciassifier[D].Kentucky,US A:University of Louisville,
2003.
[5] 李新运.城市空间数据挖掘方法与应用研究[D].泰安:山东科技大学,2004.
[6] 行小帅,焦李成.数据挖掘的聚类方法[J].电路与系统学报,2003,8(1):59~66.
[7] S ongül A lbayrak,Fatih Amasyal.Fuzzy C-M eans clustering on medical diagnostic system s.I nt
ernati onal X II[A].Turkish
Sy mposiu m on A rtificial I ntelligence and Neural Net w orks-T A I N N[C].Canakkale,Turkey,2003.
[8] 汤孝琴,戴汝源.数据挖掘中聚类分析的技术方法[J].微计算机信息,2003,19(1):3~4.
[9] 王美华.数据挖掘领域中的聚类方法[J].南华大学学报(理工版),2004,18(1):58~62.

本文发布于:2023-07-07 16:36:45,感谢您对本站的认可!

本文链接:https://patent.en369.cn/xueshu/183696.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:空间   煤层   划区
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图