本文收集2013年31个省市自治区部分高校有关人文社科科研方面的相关数据,利用多元统计方法对科研综合实力进行评价研究。针对主成分综合评价存在的问题,提出一些改进措施,给出了主成分综合评价的应用条件;以信息熵为工具,利用指标的变异程度度量信息差异,为科研综合实力评价提供方法参考;若第一主成分的评价结果与熵值法的评价结果通过Kendall协同系数检验,可以集成新的评价方案;通过对主成分得分进行k-均值聚类,并以最终聚类中心为类间排序标准,以第一主成分评分作为类内评价依据综合考量科研综合实力。
In this paper, we collect the data about the social science research of the universities throughout 31 provinces during a year, and then evaluate the comprehensive strength of scientific research by the multivariate statistical methods. In order to improve the comprehensive evaluation of the principal components, we introduce the application conditions. With the information entropy as a tool, we use the information difference of the index of the degree of variation of indicators to provide the basis for the comprehensive strength evaluation of scientific research. If the first principal component evaluation results and entropy method evaluation results pass the Kendall coordination coefficient test, then we can integrate the above two solutions to form a final evaluation results. We evaluate the comprehensive strength of scientific research by k-means clustering for principal component scores, choosing the final cluster center as the inter class sort criteria, and taking the first principal component score as the criteria of the inner class evaluation.
郭锦1,王思哲2,张天一1,王志刚1*
1海南大学信息科学技术学院应用数学系,海南 海口
2中南大学信息科学与工程学院自动化专业,湖南 长沙
收稿日期:2017年1月2日;录用日期:2017年1月17日;发布日期:2017年1月22日
本文收集2013年31个省市自治区部分高校有关人文社科科研方面的相关数据,利用多元统计方法对科研综合实力进行评价研究。针对主成分综合评价存在的问题,提出一些改进措施,给出了主成分综合评价的应用条件;以信息熵为工具,利用指标的变异程度度量信息差异,为科研综合实力评价提供方法参考;若第一主成分的评价结果与熵值法的评价结果通过Kendall协同系数检验,可以集成新的评价方案;通过对主成分得分进行k-均值聚类,并以最终聚类中心为类间排序标准,以第一主成分评分作为类内评价依据综合考量科研综合实力。
关键词 :科研综合实力,主成分分析,熵值法,Kendall检验,k-均值聚类
在当今信息爆炸时代,数据已渗透到每一个行业和业务职能领域,成为重要的生产因素,引起了产业界、科技界和政府部门的高度关注,大数据挖掘技术已经上升为国家战略。分类、估计、检验、回归分析、相关性分析等构成数据挖掘的核心内容。多元统计分析是处理多维同体观测数据的数学方法,是数理统计学近几十年迅速发展的一个分支,计算机技术的发展为多元统计方法应用提供了便利的计算工具 [
主成分分析是多元统计的核心内容之一,广泛应用于多指标的综合评价体系,得到了科研工作者的一致认同,但在应用中存在这样或那样的问题,研究者从不同角度分析问题存在的原因并给出相应的解决办法。如林海明等 [
本文收集2013年31个省市自治区部分高校有关人文社科科研方面的相关数据 [
主成分分析起源于20世纪初Karl Pearson和Charles Spearmen等人有关智力测验的统计分析中,广泛应用于多指标的综合评价体系。它的主要优点在于消除评价指标之间的相互影响,能更客观地描述变量的相对地位,同时,数学变换过程生成的信息量权数和系统权数比人为确定的权数更客观,操作性更强。本例中通过计算变量之间的简单相关系数和反映像相关矩阵(对角线上元素较接近1,其余元素的绝对值都较小),适合进行因子分析,进一步,对数据进行巴特利特球度检验(Bartlett Test of Sphericity)和KMO (Kaiser Meyer Olkin)检验,表1给出了KMO值为0.846,变量间相关性较强,巴特利特球度检验统计量观测值为400.067,相应概率为0,小于给定的显著性水平(0.05),变量适合进行因子分析。
根据原始变量的相关系数矩阵,采用主成分分析方法固定提取3个因子,为了对提取的因子有更好的解释,用方差最大法对因子载荷矩阵实施正交旋转,得到因子载荷矩阵。
林海明 [
主成分
构造主成分综合评价函
需要指出的是,上述综合评价函数是当第一主成分方差贡献不够高(64.64%)时,采用以方差贡献率
取样足够度的Kaiser-Meyer-Olkin度量 | 0.846 | |
---|---|---|
近似卡方 | 400.067 | |
Bartlett 的球形度检验 | df | 21 |
Sig. | 0.000 |
表1. 科研因子分析KMO和Bartlett的检验结果
变量 | 初始因子载荷矩阵 | 旋转因子载荷矩阵 | |||
---|---|---|---|---|---|
主成分1 | 主成分2 | 主成分3 | 因子1 | 因子2 | |
投入人年数 | 0.984 | −0.004 | −0.139 | 0.840 | 0.683 |
投入高级职称的人年数 | 0.992 | −0.050 | −0.071 | 0.871 | 0.632 |
投入科研事业费(百元) | 0.904 | −0.313 | 0.265 | 0.934 | 0.304 |
课题总数 | 0.960 | −0.016 | −0.037 | 0.826 | 0.586 |
专著数 | 0.935 | −0.277 | 0.060 | 0.942 | 0.490 |
论文数 | 0.955 | 0.135 | −0.189 | 0.743 | 0.709 |
获奖数 | 0.717 | 0.673 | 0.179 | 0.258 | 0.277 |
表2. 因子载荷矩阵
为权重,构造的综合得分函数,这种方法看似能提高信息含量(提高方差贡献率),其实是一种错觉 [
也就是说,综合得分的方差
熵的概念产生于热力学,用来描述离子或分子运动的不可逆现象,后来引入到信息论中广泛应用于赋权,熵值法是一种客观赋权法,根据各项指标观测值所提供信息的大小来确定指标权重。设有
1) 将各指标同度量化,第
2) 计算第
3) 计算第
4) 计算综合评价值:
SPSS20计算出熵值法各省市评分和排名见表5。
利用信息熵为工具计算各指标的权重,为多指标评价提供依据,当所选指标过多就难免出现指标之间存在一定的关系,被评价对象的信息重叠性会造成被评价对象的歪曲评价;利用主成分筛选出的指标之间的相关关系较弱,能有效避免信息的重复性。如果采用第一主成分的评价结果与采用熵值法得到的综合评价结果通过协同系数一致性检验, 则可以考虑将两种方法的评价值进行集成综合评价。
Kendall协同系数检验是一种多配对样本的非参数检验方法,与Friedman检验相结合,实现对评价标准是否一致的判断。首先检验第一主成分评分和熵值法评分是否存在显著性差异,采用Friedman检验,然后将该问题延伸,不是从评分是否存在显著性差异的角度分析,而是在认定主成分评分和熵值法评分标准是否一致。如果利用Friedman方法检验出评分不存在显著性差异,则意味着两种方法的评价标准不一致。对评价标准的一致性检验可以通过Kendall协同系数检验来完成,其原假设是“主成分评价和熵值法评价标准不一致”。SPSS20自动计算协同系数统计量的观测值和对应概率
表3给出了第一主成分评价与熵值法评价的一致性检验,协同系数为0.051,在显著性水(0.05)下,认为两种方法具有一致性。我们可以将两种评价结果集成,权重系数可以通过专家根据经验确定(利用专家经验综合考量),为了简单,选取综合评分函数为
主成分熵值集成综合评价法能巧妙地综合主成分分析法和熵值法的优点,且通过了一致性检验,能有效评价省市科研综合实力。由于第一主成分方差贡献率不够高(64.64%),第二主成分方差贡献率为30.24%,第一主成分包含原始数据的信息不够大,仅仅按照第一主成分得分排序有一定的片面性,可以考虑将主成分分析和聚类分析结合起来,采用主成分聚类评价。先将第一第二主成分得分标准化值(累计方差贡献率为94.886%)作k-均值聚类,分成4类,采用欧氏距离,最终类中心作为类间排序依据(本例类间排序顺序为1324) (表4),类内按照第一主成分得分排序,得到省市综合评价结果(表5)。
样本容量 | 协同系数 | 卡方 | 自由度 | 渐近显著性 |
---|---|---|---|---|
31 | 0.051 | 1.581 | 1 | 0.209 |
表3. Kendall 协同系数检验结果
聚类 | ||||
---|---|---|---|---|
1 | 2 | 3 | 4 | |
第一主成分 | 4.27450 | 0.00101 | 1.27997 | −0.36907 |
第二主成分 | −0.83227 | 1.89223 | 0.01659 | −0.39448 |
表4. 主成分k-均值聚类最终聚类中心
省市 | 主成分评价 | 熵值法评价 | 第一主成分熵值集成 | 主成分聚类评价 | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
第一主成分 | 第二主成分 | 综合评价 | 综合评分 | 排名 | 综合评分 | 排名 | 类别 | 第一主成分 | 排名 | ||||
得分 | 排名 | 得分 | 排名 | 得分 | 排名 | ||||||||
北京 | 4.27 | 1 | −0.83 | 26 | 2.51 | 1 | 0.13 | 1 | 1.32 | 1 | 1 | 4.27 | 1 |
天津 | −0.14 | 15 | −0.06 | 16 | −0.11 | 14 | 0.03 | 13 | −0.04 | 14 | 4 | −0.14 | 17 |
河北 | 0.12 | 8 | −0.45 | 19 | −0.06 | 13 | 0.03 | 14 | −0.02 | 13 | 4 | 0.12 | 11 |
山西 | −0.14 | 14 | −0.64 | 21 | −0.28 | 19 | 0.02 | 20 | −0.13 | 19 | 4 | −0.14 | 16 |
内蒙 | −0.97 | 31 | 0.03 | 11 | −0.62 | 26 | 0.01 | 24 | −0.30 | 26 | 4 | −0.97 | 31 |
辽宁 | 0.24 | 7 | 0.89 | 5 | 0.42 | 7 | 0.05 | 8 | 0.24 | 7 | 2 | 0.24 | 6 |
吉林 | 0.08 | 12 | −0.03 | 13 | 0.04 | 12 | 0.03 | 12 | 0.04 | 12 | 4 | 0.08 | 15 |
黑龙江 | −0.49 | 21 | −0.03 | 14 | −0.33 | 21 | 0.02 | 19 | −0.15 | 21 | 4 | −0.49 | 21 |
上海 | 1.56 | 2 | −0.74 | 23 | 0.78 | 5 | 0.06 | 7 | 0.42 | 5 | 3 | 1.56 | 2 |
江苏 | 0.54 | 5 | 2.90 | 1 | 1.23 | 2 | 0.09 | 2 | 0.66 | 2 | 2 | 0.54 | 5 |
浙江 | −0.32 | 17 | 1.32 | 4 | 0.19 | 9 | 0.04 | 9 | 0.12 | 9 | 2 | −0.32 | 8 |
安徽 | 0.11 | 10 | −0.75 | 24 | −0.16 | 17 | 0.02 | 18 | −0.07 | 17 | 4 | 0.11 | 13 |
福建 | 0.27 | 6 | −0.99 | 30 | −0.13 | 15 | 0.02 | 15 | −0.05 | 15 | 4 | 0.27 | 10 |
江西 | −0.21 | 16 | −0.05 | 15 | −0.15 | 16 | 0.02 | 17 | −0.06 | 16 | 4 | −0.21 | 18 |
山东 | −0.35 | 18 | 2.80 | 2 | 0.62 | 6 | 0.07 | 3 | 0.34 | 6 | 2 | −0.35 | 9 |
河南 | −0.44 | 20 | 0.24 | 7 | −0.21 | 18 | 0.02 | 16 | −0.09 | 18 | 4 | −0.44 | 20 |
湖北 | 1.34 | 3 | 0.21 | 8 | 0.93 | 3 | 0.06 | 5 | 0.49 | 3 | 3 | 1.34 | 3 |
湖南 | −0.11 | 13 | 1.55 | 3 | 0.40 | 8 | 0.06 | 6 | 0.23 | 8 | 2 | −0.11 | 7 |
广东 | 0.94 | 4 | 0.58 | 6 | 0.79 | 4 | 0.06 | 4 | 0.42 | 4 | 3 | 0.94 | 4 |
广西 | −0.75 | 27 | 0.16 | 9 | −0.44 | 22 | 0.02 | 22 | −0.21 | 22 | 4 | −0.75 | 27 |
海南 | −0.53 | 23 | −1.01 | 31 | −0.65 | 27 | 0.01 | 26 | −0.32 | 27 | 4 | −0.53 | 23 |
重庆 | −0.36 | 19 | −0.23 | 18 | −0.30 | 20 | 0.02 | 21 | −0.14 | 20 | 4 | −0.36 | 19 |
四川 | 0.09 | 11 | 0.07 | 10 | 0.08 | 10 | 0.04 | 10 | 0.06 | 10 | 4 | 0.09 | 14 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
贵州 | −0.75 | 26 | −0.80 | 25 | −0.73 | 28 | 0.00 | 28 | −0.36 | 28 | 4 | −0.75 | 26 |
云南 | −0.51 | 22 | −0.61 | 20 | −0.52 | 24 | 0.01 | 25 | −0.25 | 24 | 4 | −0.51 | 22 |
西藏 | −0.83 | 30 | −0.91 | 29 | −0.81 | 31 | 0.00 | 31 | −0.40 | 31 | 4 | −0.83 | 30 |
陕西 | 0.11 | 9 | 0.02 | 12 | 0.08 | 11 | 0.03 | 11 | 0.06 | 11 | 4 | 0.11 | 12 |
甘肃 | −0.62 | 25 | −0.22 | 17 | −0.47 | 23 | 0.02 | 23 | −0.23 | 23 | 4 | −0.62 | 25 |
青海 | −0.79 | 29 | −0.87 | 27 | −0.78 | 30 | 0.00 | 30 | −0.39 | 30 | 4 | −0.79 | 29 |
宁夏 | −0.77 | 28 | −0.89 | 28 | −0.77 | 29 | 0.00 | 29 | −0.38 | 29 | 4 | −0.77 | 28 |
新疆 | −0.58 | 24 | −0.65 | 22 | −0.57 | 25 | 0.01 | 27 | −0.28 | 25 | 4 | −0.58 | 24 |
表5. 各省市科研综合实力评价表
主成分分析广泛应用于多指标的综合评价体系,得到了科研工作者的一致认同,但主成分综合评的局限性也是不可忽视的,一方面,主成分分析综合评价有一定的应用条件,如变量是正向的、标准化的,主成分载荷矩阵达到简单结构(或初始主成分的载荷矩阵与旋转后的因子载荷矩阵都是差异不大的简单结构),主成分正向,主成分与变量显著相关等,缺乏应用条件会导致评价结果不合理甚至误判,另一方面,综合评价函数以方差贡献率为权重,不仅不能提高信息量(增加方差贡献率),反而会减少方差贡献率。熵值法综合评价是以信息熵为工具,利用指标间的变异程度度量各指标的信息差异,为科研综合实力评价提供依据,但当指标之间存在相关关系时会导致被评价对象的信息具有一定的重复性,从而造成对被评价对象的歪曲评价。利用第一主成分与熵值法的综合评价结果,一方面,可以克服在第一主成分方差贡献率不能达到要求,选用多个主成分会导致综合评价函数权重系数不能确定的问题,另一方面,经过主成分筛选出来的指标之间的相关关系较弱,可以有效避免信息的重复,通过Kendall一致性检验能验证两种方法的一致性,因此,综合集成的结果较为理想, 但权重系数的确定也是一个值得商讨的问题。主成分聚类评价能有效避免第一主成分方差贡献率不足的问题,综合多个主成分能有效提高综合评价的信息量,一方面,类内评价采用第一主成分得分排序充分体现第一主成分的主导作用,也能有效避免系数权重的选取问题,另一方面,类间距离采用多个主成分欧氏距离计算同时会掩盖第一主成分的主导作用,当第一主成分方差贡献率比较大,第二主成分方差贡献率比较小时会导致歪曲的评价结果。在实际应用中,可以采用多种方法、考虑多种评价结果会达到更理想的效果。
国家自然科学基金(项目编号11526065,11601108)、海南省自然科学基金(项目编号20161002)、海南大学教育教学改革研究项目(项目编号hdjy1715)和海南省中西部高校提升综合实力工作资金项目资助。
郭锦,王思哲,张天一,王志刚. 科研综合实力评价方法研究 Research on Evaluation Method of Comprehensive Strength[J]. 应用数学进展, 2017, 06(01): 37-44. http://dx.doi.org/10.12677/AAM.2017.61005