股民天地 > 大盘分析 > 投资理财 > 正文
什么是相关系数?相关系数的应用及缺点
2020-4-23 14:36:00 作者:jincvip  次阅读 分享到:

相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。

依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。

相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。

简单相关系数:又叫相关系数或线性相关系数,一般用字母P 表示,是用来度量变量间的线性关系的量。

复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。

典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

应用:

概率论

【例】若将一枚硬币抛n次,X表示n次试验中出现正面的次数,Y表示n次试验中出现反面的次数。计算ρXY。

解:由于X+Y=n,则Y=-X+n,根据相关系数的性质推论,得ρXY = − 1。

企业物流

【例】一种新产品上市。在上市之前,公司的物流部需把新产品合理分配到全国的10个仓库,新品上市一个月后,要评估实际分配方案与之前考虑的其他分配方案中,是实际分配方案好还是其中尚未使用的分配方案更好,通过这样的评估,可以在下一次的新产品上市使用更准确的产品分配方案,以避免由于分配而产生的积压和断货。表1是根据实际数据所列的数表。

通过计算,很容易得出这3个分配方案中,B的相关系数是最大的,这样就评估到B的分配方案比实际分配方案A更好,在下一次的新产品上市分配计划中,就可以考虑用B这种分配方法来计算实际分配方案。

聚类分析

【例】如果有若干个样品,每个样品有n个特征,则相关系数可以表示两个样品间的相似程度。借此,可以对样品的亲疏远近进行距离聚类。例如9个小麦品种(分别用A1,A2,...,A9表示)的6个性状资料见表2,作相关系数计算并检验。

由相关系数计算公式可计算出6个性状间的相关系数,分析及检验结果见表3。由表3可以看出,冬季分蘖与每穗粒数之间呈现负相关(ρ = − 0.8982),即麦冬季分蘖越多,那么每穗的小麦粒数越少,其他性状之间的关系不显著。

缺点:

需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。

相关内容:
市净率是什么?“市净率即PB比率,即每股股价(Price)与每股净资产(BookValue)的比率,也等...
2020-4-23 13:44:00
指流动资产总额和流动负债总额之比。流动比率表示企业流动资产中在短期债务到期时变现...
2020-4-23 13:28:01
资产负债率是企业负债总额占企业资产总额的百分比。这个指标反映了在企业的全部资产中...
2020-4-23 13:21:27
近日,新三板的持续改革令市场出现了久违的火爆。特别是公募基金可以投资新三板精选层公...
2020-4-23 11:18:18
随着上市公司一季报的渐次披露,阳光私募特别是百亿级私募今年一季度的投资图谱陆续浮出...
2020-4-23 11:03:23
网站简介 联系我们 免责条款 广告服务 网站地图 用户服务 
免责声明:本网站提供之资料或信息,仅供投资者参考,不构成投资建议。股市有风险,入市须谨慎!
Copyright 2011, Hubei Smart Technology Co,Ltd. All rights reserved.
联系电话:400-690-9926 E-MAIL:mbl516@163.com 鄂ICP备12014895号-3 鄂公网安备42282209000026号
网络经济主体信息