首页 行业资讯 宠物日常 宠物养护 宠物健康 宠物故事

数据处理及建立模型

发布网友 发布时间:2022-04-22 01:25

我来回答

1个回答

热心网友 时间:2023-11-29 22:35

9.2.2.1 统计量的选取

基于对金刚石/钻石中E型石榴子石包裹体元素含量统计分析来对其产地来源识别,需要预先搜集世界各地已知的前人研究测试的数据,来建立数学模型,以得出产地来源与包裹体元素含量之间的某些联系。表9.1是参与此次统计分析的数据来源及样本数。

参与本文统计分析和绘图等所用的数据,全部来源于该表中对应的文献(附表6)。因此,若下文中无再注明出处或其他特殊说明,其数据均默认来自于该表对应产地的文献,其数字序号也对应相应产地。

表9.1 各产地金刚石石榴子石包裹体电子探针测试数据条数归纳(单位:条) Table 9.1 Statistics of EPMA test data of garnet inclusions in diamonds from different origins (unit: piece of data)

由于判别分析需要从中筛选出能提供较多信息的变量方能使错判概率变小,因此统计变量的选取尤为重要。包裹体的测试数据包含了数十种元素及其对应氧化物的含量,倘若一一研究,不仅计算量大,计算复杂,而且容易出现重复统计造成较大误差等。在此,作者选定了其中的FeO、MgO、CaO三种组分参数作变量,这样选变量基于如下理由(黄进初,1990):

(1)Si组分作为石榴子石硅酸盐矿物的主常量组分,不参与此次的统计研究;

(2)Ti、Ni、K、Na、Cr等组分在石榴子石中的含量较低(测试误差大),且测试数据不全(只有某些产地的测试数据,部分产地的测试数据缺失),因此其数值代入统计研究中会引起较大的误差;

(3)FeO、MgO、CaO三个组分是石榴子石中对其种类成分产生主要制约的组分,也是和地幔性质有明显关联性的组分。对归纳的167条E型石榴子石测试数据的预处理显示,各产地FeO、MgO、CaO三个统计变量的数据全,且其组间方差与组内方差比值较大,是各产地间差异性比较大的三种组分参数(其中,Mn2+含量算入Fe2+含量中)。

9.2.2.2 产地归类

对于金刚石/钻石来说,由于其形成环境和条件较为“苛刻”,且世界各产地间由于“历史上”地理位置靠近、幔源性质相近等原因,某些产地间相关包裹体性质具有很大的相似性,仅仅靠一条信息(石榴子石包裹体元素含量统计分析)也许不能区分到具体的每一个产地。为此,本文将先对相似的产地进行归类,研究石榴子石元素含量差异显著的几个代表产地(石榴子石含量差异不显著的产地间将用其他信息来补充区分,本文不详细讨论)。

在此,作者使用主成分综合评价法(陈述云,张崇甫,1995;叶宗裕,2006;阎慈琳,1998),通过将相关统计变量进行主成分分析得到的若干个主成分按线性加权得到一个综合性评价指标,来观察不同产地间的E型石榴子石包裹体地球化学异同。由此,对搜集的各产地E型石榴子石包裹体数据,通过将统计变量FeO、MgO、CaO进行主成分分析,用将所得到的n(1≤n≤3)个主成分按公式9.1提取一个综合主成分:

联合国金伯利进程框架下的钻石原产地研究

其中,Fi为第i(1≤i≤n)个主成分,λi为主成分Fi对应的特征值,λ为n个主成分的特征值之和。这里取n=2时,其方差累积百分比达99.711%,说明这两个主成分可以很好地综合FeO、MgO、CaO这三个统计变量的信息,且综合主成分值反应产地间的地球化学异同应该具有一定的可靠性。因此,将不同产地综合主成分的平均值作图得到如图9.8。

根据图9.8,将主成分均值相近的产地分为以下四大组,每组内部对应产地E型石榴子石包裹体元素差异较小,而不同组之间差异较明显,可以获得较好的区分度(表9.2)。

图9.8 各产地金刚石E型石榴子石包裹体统计量综合主成分均值图

Figure 9.8 Mean value of comprehensive principle components of garnets inclusions in eclogitic diamonds all over the world

表9.2 产地分组表* Table 9.2 Groups of diamond origins

表格中的数字序号对应表9.1中的相应产地

9.2.2.3 判别模型的建立

通过判别分析找出各组间的差异性,并建立一个判别模型,作为识别未知产地来源的依据之一。这里使用Fisher判别法,通过坐标变换的方式将数据点投影到另一个坐标系,再用一元方差分析的检验手段将新坐标系中水平差异显著的不同组区分开来,将待判别样本归入离新坐标系中质心最近的组。本文的判别分析过程在统计软件SPSS中进行。

由此,将这4组的FeO、MgO和CaO含量作为统计量,根据表9.2的分组进行判别分析。分析结果部分显示如表9.3所示。

从以上3个表中得到的有用信息如下:

表9.3显示,判别的总判别正确率为67.1%,其中组Ⅰ和组Ⅳ的判别正确率都在80%以上,区分效果较好;但组Ⅱ的正确率仅为50%左右,显示第二组归类样品FeO、MgO和CaO含量的信息与其他几个组之间相关信息的区分度不够明显。

表9.4显示,非标准化的判别方程系数,可以得到一个判别方程组如下:

联合国金伯利进程框架下的钻石原产地研究

其中Ex为判别得分,C为对应物含量。

从表9.5显示,依判别方程,将各组统计量的均值代入可得相应组的质心。若将某个未知来源产地的金刚石E型石榴子石相应FeO、MgO和CaO含量分别代入判别方程9.2组得到的结果E1、E2、E3离哪组的质心距离最近,则认为该金刚石/钻石来源于该产地。图9.9显示,各组质心在同一平面直角坐标系中的位置有显著距离,且各组样本共167条数据作相应转换后的投点归属基本正确,正确率应为67%左右。

图9.10更为直观地显示出不同产地的特征差异:通过四个大组的统计量求氧化物对应的阳离子含量,投Fe-Mg-Ca三元原子百分比图。由于不同组样本数不均,且同组不同产地间仍存在不可避免的部分差异,在以组为单位投点后,为作图的美观性和结果的直观性,每组又再取了一个代表产地的统计量参与对比作图(图9.10)

如图9.10所示,相同产地金刚石/钻石E型石榴子石包裹体Fe、Mg、Ca成分有较好的集聚,而不同产地间又有一定分散的分布,因此具有好的区别性,其中:

表9.3 分组结果 Table 9.3 Regrouping results

*总的判别正确率为67.1%

表9.4 典则判别式函数系数 Table 9.4 Coefficients of Canonical discriminant function

表9.5 组质心处的函数 Table 9.5 Functions at Group Centroids

图9.9 E型石榴子石包裹体产地来源典则判别函数图

Figure 9.9 Canonical discriminant function of garnet inclusion sourcing of eclogitic diamonds

图9.10 金刚石E型石榴子石包裹体Fe-Mg-Ca 原子百分比图

Figure 9.10 Percentage diagram of Fe-Mg-Ca atoms of garnet inclusions in eclogitic diamonds

(1)第一组,加拿大Jericho产地,其平均Mg含量较高,但平均Ca含量较低,Fe含量则分布较散(这里的Fe含量是指Fe2+含量,下同)。

(2)第二组,相应产地的投点则相对分散(图9.9左),这与判别分组结果(表9.2):组Ⅱ的判别正确率较低相吻合;但其中南非Venetia产地,以其最低的平均Fe含量和最高的平均Ca含量与其他产地有着明显区别(图9.9右);造成此结果的可能原因将在下文中分析。

(3)第三组,相应产地的投点虽然也有部分分散,但大部分集中在与委内瑞拉Guaniamo产地相近的区域:其特征是各端元含量都居于三个产地之间,这和该组的综合主成分均值也居于所有产地之间结果相吻合。

(4)第四组南非Finsch产地,其特征是平均Fe含量最高,而Ca和Mg含量都相对偏低,与其他组区别明显。

由此可见,不同产地来源的金刚石/钻石E型石榴子石包裹体地球化学性质确存在有较明显的差异性,应该可作为判断未知产地来源的依据之一。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com