省企联网站建设要求,网站设计实训心得体会,网络管理系统平台有哪些,做网站推广的技巧假设各个指标之间的水平相差很大#xff0c;此时直接使用原始指标进行分析时#xff0c;数值较大的指标#xff0c;在评价模型中的绝对作用就会显得较为突出和重要#xff0c;而数值较小的指标#xff0c;其作用则可能就会显得微不足道。 因此#xff0c;为了统一比较的标… 假设各个指标之间的水平相差很大此时直接使用原始指标进行分析时数值较大的指标在评价模型中的绝对作用就会显得较为突出和重要而数值较小的指标其作用则可能就会显得微不足道。 因此为了统一比较的标准保证结果的可靠性我们在分析数据之前需要对原始变量进行一定的处理即我们本期内容将向大家介绍的数据的标准化处理将原始数据转化为无量纲、无数量级差异的标准化数值消除不同指标之间因属性不同而带来的影响从而使结果更具有可比性。 数据的标准化
数据的标准化是通过一定的数学变换方式将原始数据按照一定的比例进行转换使之落入到一个小的特定区间内例如0~1或-1~1的区间内消除不同变量之间性质、量纲、数量级等特征属性的差异将其转化为一个无量纲的相对数值也就是标准化数值使各指标的数值都处于同一个数量级别上从而便于不同单位或数量级的指标能够进行综合分析和比较。
数据标准化处理的类型
数据标准化处理主要包括指标一致化处理和无量纲化处理两种类型。 一、指标一致化处理 指标一致化处理主要解决的是数据之间不同性质的问题。例如我们在评价多个不同指标的作用时某一类指标数值越大越好我们称之为正指标例如诊断符合率、病床平均周转次数等指标 另有一类指标数值越小越好我们称之为逆指标例如平均住院日、围产期婴儿死亡率等指标。 在这种情况下如果同时评价这两类指标的综合作用由于他们的作用方向不同将不同性质的指标作用直接相加并不能正确反映不同作用方向产生的综合结果此时我们就需要对逆指标进行一致化处理改变逆指标的性质和作用方向使所有指标作用方向一致化从而得出适宜的结果。 针对逆指标一致化处理的方法主要有两种 1、倒数一致化即对原始数据取倒数X’ 1 / xx0 2、减法一致化即利用该指标允许范围内的一个上界值M依次减去每一个原始数据X’ M - x 注意倒数一致化常常会改变原始数据的分散程度这种改变会夸大或缩小原始数据的实际差异对于进行综合评价是不利的。而减法一致化则不改变数据的分散程度因此结果较倒数一致化而言会更加稳定。 二、无量纲化处理 数据无量纲化处理主要解决数据之间可比性的问题这也是我们对数据进行标准化处理的最主要的一个目的。 在实际的应用中由于不同变量自身的量纲不同数量级存在较大差异在进行综合评价时不同变量所占的作用比重也会有所不同。例如某个变量的数值在1-10之间而另一个变量的数值范围在100-1000之间此时若进行综合评价从数值的角度很有可能数值变化范围大的变量它的绝对作用就会较大所占的比重较大。 因此为了消除量纲、变量自身变异和数值大小的影响比较不同变量之间的相对作用就需要对数据进行无量纲化处理将其转化为无量纲的纯数值来进行评价和比较。
常用的数据标准化方法
一、极差标准化法 极差标准化法是消除变量量纲和变异范围影响最简单的方法。 具体的操作方法为首先需要找出该指标的最大值Xmax和最小值Xmin并计算极差R Xmax - Xmin然后用该变量的每一个观察值X减去最小值Xmin再除以极差R即 X’ (X-Xmin) / (Xmax-Xmin) 经过极差标准化方法处理后无论原始数据是正值还是负值该变量各个观察值的数值变化范围都满足0≤X’≤1并且正指标、逆指标均可转化为正向指标作用方向一致。但是如果有新数据加入就可能会导致最大值Xmax和最小值Xmin发生变化就需要进行重新定义并重新计算极差R。 二、Z-score标准化法 当我们遇到某个指标的最大值和最小值未知的情况时或者有超出取值范围的离群数值的时候就不再适宜计算极差了此时我们可以采用另一种数据标准化最常用的方法即Z-score标准化也叫标准差标准化法。 具体的操作方法为 经过Z-score标准化后数据将符合标准正态分布即将有约一半观察值的数值小于0另一半观察值的数值大于0变量的均值为0标准差为1变化范围为-1≤X’≤1。 三、线性比例标准化法 1、极大化法 对于正指标取该指标的最大值Xmax然后用该变量的每一个观察值除以最大值即X’X / Xmax。X≥0 2、极小化法 对于逆指标取该指标的最小值Xmin然后用该变量的最小值除以每一个观察值即X’ Xmin / X。X0 注意以上两种方法不适用于X0的情况。对于逆向指标使用线性比例法进行标准化后实际上是进行了非线性的变换变换后的指标无法客观地反映原始指标的相互关系转换时需要注意。 四、log函数标准化法 首先对该变量的每一个观察值取以10为底的log值然后再除以该指标最大值Xmax的log值即 X’log10X / log10 Xmax 注意此方法要求X≥1。 五、反正切函数标准化法 通过三角函数中的反正切函数arctan也可以实现数据的标准化转换计算方法如下 X’ arctan(X)*2 / π 注意如果原始数据为正、负实数则标准化后的数据区间为-1≤X’≤1若要得到0≤X’≤1区间则原始数据应该保证X≥0。 当然数据标准化的处理还有其他方法最常用的还是前两种极差标准化法和Z-score标准化法。