公司网站想自己做,seo搜索引擎优化是什么意思,一个虚拟主机如何建多个网站代码,做网站页面的软件χ2检验#xff08;Chi-Square Test#xff09;是一种用于检验分类变量之间是否存在相关性的统计方法。χ2检验的原理基于观察到的频数与期望频数之间的偏差来判断分类变量之间是否存在显著的关联。 χ2检验的原理可以概括为以下几个步骤#xff1a; 建立假… χ2检验Chi-Square Test是一种用于检验分类变量之间是否存在相关性的统计方法。χ2检验的原理基于观察到的频数与期望频数之间的偏差来判断分类变量之间是否存在显著的关联。 χ2检验的原理可以概括为以下几个步骤 建立假设首先需要建立零假设H0和备择假设H1。在χ2检验中零假设通常是假设两个分类变量之间没有关联备择假设则是它们之间存在关联。 计算期望频数根据观察到的数据计算期望频数。期望频数是基于零假设下的预期频数它告诉我们如果零假设成立我们期望在每个组中看到多少观察值。 计算χ2统计量根据观察频数和期望频数计算χ2统计量。χ2统计量衡量了观察值与期望值之间的偏差程度它的计算公式为χ2 Σ [(观察频数 - 期望频数)^2 / 期望频数]。 确定显著性水平选择显著性水平通常为0.05用来评估χ2统计量的显著性。 比较χ2统计量与临界值根据自由度和显著性水平查找χ2分布表找到临界值。将计算得到的χ2统计量与临界值进行比较。 做出决策如果计算得到的χ2统计量大于临界值则拒绝零假设认为分类变量之间存在关联如果小于临界值则接受零假设认为分类变量之间没有关联。 通过以上步骤χ2检验可以帮助我们判断分类变量之间是否存在关联并评估这种关联的显著性。 这个意思是根据给定的数据对比了男性和女性病例的阳性率并进行了χ2检验来评估两者之间的差异是否具有统计学意义。
例子 男性病例总数为 7,866其中阳性病例数为 342阳性率为 4.35%。 女性病例总数为 6,038其中阳性病例数为 310阳性率为 5.13%。 进行χ2检验后得到的结果是
χ2值为 4.726。 P值为 0.030。 在这种情况下通过对比两个性别的阳性率并进行χ2检验发现两个性别之间的差异具有统计学意义。也就是说男性和女性病例的阳性率之间的差异不太可能是由随机因素引起的而可能存在有意义的关联或差异。 需要注意的是P值显著性水平小于0.05这意味着我们可以以95%的置信度拒绝零假设即男性和女性病例的阳性率之间存在显著差异。
使用R语言实现卡方检验 table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果)阳性 阴性男 1507 1126女 1429 971我们看到这个数据男性阳性人数为1507阴性为1126女性阳性为1429阴性为971我们使用卡方检验看一看阳性率是否在性别上存在差异。 chisq.test(table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果))Pearsons Chi-squared test with Yates continuity correctiondata: table(MP2064_year_jijie$性别, MP2064_year_jijie$检测结果)
X-squared 2.6543, df 1, p-value 0.1033
我们看到χ22.6543自由度为1p0.10330.05,所以可以认为阳性率在性别上的分布没有差异。 table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果)阳性 阴性男 3148 2963女 2912 2402 chisq.test(table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果))Pearsons Chi-squared test with Yates continuity correctiondata: table(cil_jiahuanzhehao_xiuyear$性别, cil_jiahuanzhehao_xiuyear$检测结果)
X-squared 12.183, df 1, p-value 0.0004823
换一组数据就有了差异。