当前位置: 首页 > news >正文

专业网站建设常州什么是网络营销 网络营销有哪些特点

专业网站建设常州,什么是网络营销 网络营销有哪些特点,专做polo衫的网站,网站自适应屏幕一文整理了卡方检验全部内容#xff0c;包括卡方检验的定义#xff08;基本思想、卡方值计算、适用条件分析#xff09;、卡方检验分类#xff08;2*2四格表卡方、R*C表格卡方、配对卡方、卡方拟合优度检验、分层卡方#xff09;、卡方检验如何分析#xff08;数据格式、…一文整理了卡方检验全部内容包括卡方检验的定义基本思想、卡方值计算、适用条件分析、卡方检验分类2*2四格表卡方、R*C表格卡方、配对卡方、卡方拟合优度检验、分层卡方、卡方检验如何分析数据格式、软件操作、结果解读、卡方多重比较、卡方检验在其他方面的应用多选题分析、logistic回归分析筛选变量、定类数据关系的可视化分析、趋势卡方判断是否有线性趋势、对比分析参数检验与非参数检验、差异性分析的其他方法等5大部分内容。 卡方检验定义基本思想 卡方检验又称独立性检验是由数学家卡尔·皮尔逊发明的用于检验两变量是否相关的假设检验方法。其基本思想是统计样本的实际频数与理论频数的吻合程度主要应用于定类数据和定类数据之间的关系分析即我们常说的定类数据与定类数据之间的差异性研究。比如研究男生女生是否吸烟的差异。 卡方检验的基本思想也可以通过卡方值的基本公式来理解。卡方值计算1卡方值计算公式 卡方值基本公式——Pearson \chi^2\sum\frac{(O-E)^2}E(\chi^2\geq0) 式中O为实际频数E为理论频数卡方值表示实际频数与理论频数之间的偏离程度。卡方值越大则实际频数与理论频数的偏离程度越大。 同时卡方值大小还受自由度的影响自由度v越大卡方值也会越大所以只有考虑了自由度v的影响卡方值才能正确反映实际频数与理论频数的偏离程度。2卡方检验自由度 卡方检验的自由度与样本量n无关取决于列联表中可以自由取值的格子个数自由度计算公式v行数-1*列数-1。比如四格表中有两行两列数据自由度(2-1)*(2-1)1。3理论频数计算 卡方值计算公式中涉及到理论频数的计算卡方检验理论频数的计算是根据假设检验H0成立的前提下计算所得的理论频数。 具体计算方法为对于每个单元格其理论频数E(行合计×列合计)/总样本数n。也就是第R行第C列单元格的理论频数E (第R行合计×第C列合计)/总样本量n。 适用条件判断 一般情况下我们所说的卡方检验均为Pearson卡方卡方值基本公式也为Pearson卡方值计算公式。除此之外还有两种卡方值——yates连续性校正卡方和Fisher卡方值。 三种卡方值的选择需要结合变量个数、样本量n、理论频数E分布情况等选择最终应该使用的卡方值。具体选择标准如下 针对2*2四格表R2C2n40且 E全部5则使用Pearson卡方n40但其中有1个格子出现1E5则使用yates连续性校正卡方任何一格子出现E 1或n40则使用Fisher卡方仅2*2表格使用。针对R*C表格(RC中任意一个大于2且R2,且C2)E全部1 且 1E5格子的比例小于20% 则使用Pearson卡方否则使用yates连续性校正卡方。 Yates连续性校正卡方公式 卡方检验分类 卡方检验从使用频率角度分类来分的话可分为以下5类独立样本2*2表格卡方检验四格表卡方、多独立样本R*C表格卡方检验、卡方拟合优度检验、配对设计资料卡方检验、分层卡方检验。接下来将分别进行说明。 独立样本2*2表格卡方检验 四格表卡方检验在日常研究是最常用的一种用于比较两样本构成比是否有差异。四格表是一种常用的数据表格形式表格由四个单元格组成每个单元格代表一个分类变量的不同组合。四格表示例如下表中的其余数据都可以用abcd这四个数据计算得到所以也称为四格表资料。 四格表卡方检验除上面提到的基本公式外还有一个四格表的特有公式 \chi^2\frac{(ad-bc)^2n}{(ab)(cd)(ac)(bd)}注意 n40且 E全部5则使用Pearson卡方n40但其中有1个格子出现1E5则使用yates连续性校正卡方任何一格子出现E 1或n40则使用Fisher卡方仅2*2表格使用。 多独立样本R*C表格卡方检验 R行C列RC中任意一个大于2表格资料卡方检验用于分析两定类数据之间的差异性与四格表卡方检验类似但无法确定具体哪两组数据之间存在差异需要进行多重比较常采用Bonferroni法进行两两组别之间的多重比较。SPSSAU卡方检验会自动输出多重比较分析结果。 资料示例下图展示了3*2表格卡方检验结果 利用卡方检验研究不同疗法的治疗效果的差异性从上表可以看出卡方值为21.038p值小于0.05说明不同疗法的治疗效果呈现出显著差异性。具体两两组别的差异性可查看下方多重比较结果。 分析上表可知外用膏药组、物理疗法组、药物治疗组两两组别之间进行多重比较治疗效果均呈现出显著差异性。 3、卡方拟合优度 卡方拟合优度用于分析数据的实际比例与预期比例是否一致它只针对于类别数据比如性别、职业、学历等。比如预期收集的样本男女比例为6:4那么预期比例与实际收集的样本男女比例是否一致就可以使用卡方拟合优度检验分析。 同时卡方拟合优度检验常用于问卷多选题分析用于分析多选题选项被选择比例是否有差异。后面在卡方检验应用部分也会进行详细说明。 资料示例下图展示了卡方拟合优度检验结果 针对体型进行卡方拟合优度检验研究样本数据分布是否与期望分布保持一致从上表可以看出体型全部均没有呈现显著性卡方值为7.018p0.05)说明样本体型分布与预期比例一致。 4、配对设计资料卡方检验 配对卡方检验用于分析两配对定类数据的差异比如使用两种方法对同一批患者进行诊断诊断结果为阳性阴性判断两种方法的诊断结果是否有差异可以使用配对卡方检验进行分析。 资料示例下图展示了配对卡方检验结果 分析上表可知使用配对卡方检验分析甲法、乙法诊断结果的差异性从配对卡方分析结果可以看出p0.0220.05说明甲、乙两种方法的检测结果有显著差异。 5、分层卡方检验 分层卡方是在卡方检验基础上进一步考虑分层项的干扰混杂因素。比如想要调查某一地区接种疫苗X)对感染病毒 (Y)的影响由此来判断疫苗的有效性但考虑到男性、女性体质的不同疫苗可能会造成不一样的抵抗病毒能力因此将性别 (Z)作为分层项来进行分析。就可以使用分层卡方检验进行分析。 针对分层卡方涉及到的理论知识比较多如下表格说明 通常情况下首先查看‘比值比齐性检验’如果其呈现出显著性p 值小于0.05则说明具有混杂因素即需要考虑分层项即分别查看不同分层项下的数据结果。反之如果没有通过‘比值比齐性检验’即说明没有混杂因素不需要考虑分层项报告整体的结果即可包括卡方检验以及OR值。 对于分层卡方检验的更多内容建议参考SPSSAU帮助手册说明内容较多不在这里进行说明。https://spssau.com/helps/medicalmethod/layerchi.html 卡方检验分析 上面介绍了5类卡方检验及其简单的分析过程接下来通过一个具体的卡方检验的示例详细介绍一下卡方检验的分析过程。包括卡方检验需要的数据格式、软件的操作、分析结果的详细解读、具体差异的对比、效应量的分析、多重比较如何分析等。 数据格式 使用软件进行卡方检验分析时需要注意卡方检验的数据格式。一般来讲可分为3种分别是常规格式、加权格式、列联表格式。 常规格式 一行代表一个样本一列代表一个属性将全部的原始数据信息列出即可使用数字代表定类数据的类别如下图所示 加权格式 在实际研究中很多时候没有原始数据此时就应该使用汇总数据即带加权项的数据。比如下图中X分为2类Y分为3类一种有2*36种组合数据信息只有6种组别的汇总项即加权项分别是401020302050相当于总共有170个样本如果是使用常规格式即非加权格式此时应该有170行但加权格式则只需要6行即可表示如下图所示 列联表格式 以上两种数据格式是非常常用的除此之外在使用SPSSAU的Fisher卡方进行分析时还会涉及到列联表格式数据。其本质也是加权数据的一种类型只是以列联表的形式直接输入到软件中进行分析。在编辑数据时需要注意A1单元格一定要空着并且放入的数据不包括合计数据。如下图所示 软件操作 1SPSSAU位置 SPSSAU在以下6个部分提供卡方检验的不同方法如下图 ①SPSSAU【通用方法】-【交叉(卡方)】此处分析最为简单仅提供卡方检验结果以及相应的可视化图形不会输出额外的指标及计算过程等。 ②SPSSAU【实验/医院研究】模块提供【卡方检验】【配对卡方】【卡方拟合优度】【分层卡方】【Fisher卡方】5类卡方检验。 2SPSSAU操作 以R*C表格卡方检验为例使用SPSSAU【实验/医学研究】模块【卡方检验】进行分析。 案例背景某年级想要研究重点班与普通班学习成绩优秀、及格、不及格之间是否有差异以及具体的差异在哪部分收集的数据如下 分析很显然这是一个2*3表格资料卡方检验从已知数据可知数据格式为加权格式故将数据整理成如下格式 上传数据至SPSSAU系统在【实验/医学研究】模块选择【卡方检验】拖拽变量至右侧相应分析框操作如下图 【提示】从实际意义上来讲卡方检验是会区分X与Y的但是在算法角度是不区分X与Y的。放置位置不同只会影响表格的输出格式不会影响卡方检验分析结果。分析时可选择“百分比(按列)”或者“百分比(按行)”二者的差别在于表格内数据按行加和为100%还是按列加和为100%试个人分析角度决定无固定标准并不会影响卡方检验的分析结果。 3、结果解读 本案例数据卡方检验分析结果如下 1先看p值 首先看p值是否呈现出显著性p值小于0.05或小于0.01若呈现出显著性则说明应该拒绝原假设卡方检验原假设为两定类数据之间无差异。若p值大于0.05则无差异分析停止。本案例卡方值为32.752对应p值小于0.01说明差异具有显著性即普通班与重点班的成绩具有显著差异。 2具体差异对比 括号内百分比对比 分析具有显著差异时具体可对比卡方检验结果中括号内百分比描述具体差异。本案例数据按列加和为100%具体分析可知普通班中成绩及格人数占比最高为50%优秀人数占比最少为23.684%。重点班中成绩优秀的人数占比最高为64.516%不及格人数占比最少为16.129%。同时也可以结合SPSSAU可视化图案进行直观对比如下图 如果想要横向对比也可以在分析时选择“百分比(按行)”在这里不再过多阐述。除使用括号内百分比具体对比差异还可使用效应量指标描述差异幅度。 效应量指标 卡方检验的效应量指标主要用于分析两个或多个分类变量之间的差异幅度它的取值范围在0到1之间效应量值越大说明差异幅度越大通常情况下效应量小、中、大的区分临界点分别是: 0.20、0.50和0.80。 SPSSAU卡方检验默认会提供5类效应量指标本文对各指标具体原理和计算公式不做深入探讨SPSSAU输出效应量指标结果如下 效应量指标的选择需要结合交叉表格类型以及数据类型进行选择选择标准如下 本案例为2*3表格应该使用Cramer V指标。Cramer V值为0.405表示重点班和普通班的成绩存在中等程度的差异。 3多重比较 卡方检验的结果只能知道整体是否存在差异无法对比两两组合之间的差异情况如果需要具体对比两两组合之间的差异需要使用多重比较进行分析。多重比较的次数C(X类别个数)*C(Y类别个数)比如X类别为3Y类别个数为5则为C(3,2)*C(5,2)30次。 在多重比较时通常使用Pearson卡方检验。然而随着多重比较次数的增加一类错误的概率也会增加。因此建议在显著性水平为0.05的情况下使用校正显著性水平Bonferroni校正来进行分析。例如如果两两比较次数为3次那么Bonferroni校正显著性水平为0.05/3次0.0167即p值需要与0.0167进行对比而不是0.05。 比如本案例中要分析具体差异在于优秀与及格之间还是优秀与不及格之间或者及格与不及格之间查看多重比较结果如下 从上表可以看出普通班与重点班成绩不及格与优秀之间、优秀与及格之间的差异均呈现出显著性p值小于Bonferroni校正显著性水平为0.0167。而成绩不及格与及格之间差异并未呈现出显著性那么可以认为普通班与重点班的成绩差异主要在于优秀成绩的人数上。 4卡方检验统计量过程值 在前面讲卡方检验适用条件时有提到3类卡方统计量的选择问题非专业选手可忽略SPSSAU【实验/医学研究】模块的【卡方检验】结果会自动输出卡方检验统计量过程值用于判断卡方统计量如下图 分析上表可知本案例数据为2*3表格理论频数E≥5格子占比为100%因此使用Pearson卡方即本案例输出的卡方结果为Pearson卡方。 四、卡方检验应用 卡方检验不仅可用于差异性分析在其他方面均有不同的应用。比如用于问卷多选题分析、logistic回归分析前筛选变量、可视化分析、判断是否存在线性趋势等接下来将分为进行介绍。 1、多选题分析 多选题分析首先在单独对多选题进行分析时使用的是卡方拟合优度检验分析多选题的各选项被选择比例是否一致如下图为SPSSAU多选题分析结果 从卡方拟合优度检验结果可以看出各选项被选择比例有显著差异百分比选择分布不均匀卡方值为225.749p0.05。 单选-多选分析在进行单选题与多选题的交叉分析时也会涉及到卡方检验具体为Pearson卡方如下图为SPSSAU单选-多选分析结果 从卡方检验结果可以看出对于共6项表示的多选题性别并未表现出显著的差异性即男性和女性选择课程的原因并不存在差异性。 同理多选-多选交叉分析中也涉及卡方检验在此不再进行赘述。 2、logistic回归分析 当因变量Y为定类数据时研究X对Y的影响关系应该使用logistic回归分析。当自变量非常多时首先应该进行自变量的筛选筛选出对Y有影响的X放入回归模型中。当自变量为定量数据时使用方差分析或t检验进行变量的筛选当X为定类数据时应该使用卡方检验进行变量的筛选。在进行筛选时如果害怕遗漏重要变量那么可以适当将p值放大如以0.1或0.15为标准将p值大于0.15的变量排除在外。 举例对二元logistic回归分析的因变量Y与定类变量X1-X4进行卡方检验结果如下 从上表可知除X4外X1、X2、X3与Y之间的差异均为呈现出显著性那么在进行logistic回归分析前就需要考虑是否有必要将X1、X2、X3放入模型中。 3、可视化分析 1交叉汇总图 卡方检验的选择百分比差异性可通过图形进行直观的展示SPSSAU进行卡方检验时也会自动输出对应的交叉图比较基础的如柱形图、条形图、堆积柱形图、堆积条形图等。 SPSSAU输出交叉图如下可通过右上角按钮切换图形展示方式。 2对应分析 除基础的柱形图外与卡方检验相关的可视化图形还有对应分析中得到的对应图。如果希望使用图形直观展示关系情况也或者想研究多个分类数据间的关系并且使用图形直观展示而且还需要看出类别间的具体关系情况。此时则可以使用对应分析。 对应分析是一种视觉化的数据分析方法它能够将几组看不出任何联系的数据通过视觉上可以接受的定位图展现出来。其基本思想是将一个列联表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。 举例说明研究不同收入水平人群收集品牌偏好的差异使用SPSSAU【问卷研究】模块的【对应分析】进行分析得到分析结果包括“对应表”以及“对应图”分别如下 可以看到对应表分析结果即为卡方检验的分析结果。 对应图的分析 ①离原点越远意味着该点对于‘关系幅度’的表达越强即说明该点越能体现出‘关系’。 ②点与点之间挨着越近意味着它们之间关联关系越强点与点之间挨着越远意味着它们之间关联关系越弱。 分析上图可知低收入群体与手机B、E品牌之间有着较强关系中等收入群体与手机D品牌之间有着较强关系高收入群体与A、C、F这3个手机品牌之间有着较强关系。另外低收入和B、E品牌它们离原点的距离较远意味着低收入与B、E品牌之间的关系非常明显。 4、趋势卡方检验线性趋势 卡方检验还可用于分析列联表数据的趋势差异关系具体方法为Cochran-Armitage 趋势卡方检验。比如你想要分析患肺癌的比例是否会随着年龄的增大而出现增加的趋势这里年龄为分阶段的定类数据就可以使用Cochran-Armitage 趋势卡方检验进行分析。 Cochran-Armitage 趋势卡方检验通常用于k*2(或2*k)的列联表结构k为有序定类数据2指两个类别。如果p值小于0.05则说明k组间呈现出某种趋势变化如果p值大于0.05则说明k组间不会呈现出趋势变化。 在SPSSAU【卡方检验】进行分析时默认会输出Cochran-Armitage 趋势卡方检验结果如下图 从上表可知趋势卡方检验p值大于0.05说明不同年龄段患肺癌的比例并没有呈现出趋势变化。若呈现出趋势变化则可对比卡方检验结果中的百分比进行具体描述。 五、参数检验与非参数检验 很多同学不明白为什么卡方检验属于非参数检验下面简单补充一下参数检验与非参数检验的内容。 1、基本说明 参数检验是假定样本总体为某一已知分布的情况下对总体参数如均值或者方差进行估计和检验的方法。与参数检验相对的是非参数检验非参数检验并不对总体的分布形态做假定此时不能进行参数间的比较而是做分布间的比较。 2、对比 1检验指标对比 参数检验假设数据服从某种特定的分布例如正态分布并且总体参数是已知的。因此参数检验通常关注的是样本均值与总体均值的差异以检验样本数据是否符合预期的分布。 非参数检验不需要数据符合特定的分布而是基于数据本身的分布来推断总体参数。非参数检验通常关注的是数据的次序而不是具体的值例如中位数、四分位数等。 2优缺点对比 参数检验优点在于符合条件时检验效率高。然而它对数据的要求较为严格如等级数据、非确定数据不能使用参数检验而且要求数据的分布型已知和总体方差相等。此外参数检验不适用于样本量较小且分布未知的情况。当样本量足够大时参数检验的方法对非正态分布的数据也能够很好地进行处理因为样本均值的分布根据中心极限定理是近似正态分布。 非参数检验优点在于不受总体分布的限制对数据的要求不严格应用范围广、简便、易掌握。缺点在于若对符合参数检验条件的数据用非参数检验则检验效率低于参数检验。非参数检验主要使用等级或者符号秩而不是使用原始数据会损失部分信息降低统计检验效率导致犯第二类错误的概率比参数检验大。此外当样本量较小且分布未知时通常会考虑使用非参数检验。 3、常用方法对比 常用方法对比如下 4、差异性分析的其他方法 卡方检验用于分析定类数据之间的差异性如果要分析定类与定量数据之间的差异性应该使用方差分析或者t检验进行分析。对比说明如下
http://www.hkea.cn/news/14330953/

相关文章:

  • 海外访问国内网站 dns网络营销策划书范文模板
  • 校园网上零售网站建设方案阳江兼职招聘网最新招聘
  • 微信的企业网站模板网站模板二次开发
  • 淘宝客网站建站源码免费 个人 网站
  • 阿里巴巴做网站多少钱微信公众号登录电脑版
  • 网站域名使用费多少网站视频超链接怎么做
  • 做网站加一个定位功能要多少钱软文有哪几种类型
  • 做百度联盟用什么做网站天津做网站制作
  • 流行网站设计建设部相关网站
  • 手机移动端网站建设网站 建设 汇报
  • 县级门户网站建设运营成本视频怎么制作
  • 企业网站制作建设的框架有哪几种博客网站建设设计报告
  • 行业门户网站的优化怎么做yps行业门户系统学习网站建设建议调查问卷
  • 亚马逊中国官网网站重庆网站建设公司名单
  • 北京网站建设怎么样房屋室内装修设计
  • 广告案例的网站网店铺装修设计
  • 久久建筑网是个什么样的网站卢沟桥网站建设
  • 可以做网站的编程有什么个人如何注册商标
  • 青海餐饮网站建设公司wordpress前台
  • 做网站模板 优帮云seo搜索引擎优化实战
  • 网站建设合同前期需注意哪些问题包头网站建设公司
  • 服装公司做哪个网站网站开发项目分析模板
  • 58同城建网站怎么做深圳宝安大型网站建设
  • 网站 产品图片 尺寸移动互联网开发培训
  • 计算机应用技术网站开发西南能矿建设工程公司网站
  • 商业网站设计方案wordpress 改地址
  • 网站左右箭头素材sspai 少数派wordpress
  • 可以做海报的网站电子商务平台经营者有哪些义务
  • dw设计做网站案例网站权重批量查询
  • 在网站制作前需要有哪些前期策划工作简约 网站 设计