专门做流程图的网站,网站开发慕枫,句容网站制作哪家好,海城 网站建设评价指标
均方误差#xff08; M S E MSE MSE#xff09;
定义#xff1a;预测值与实际值之间差异的平方和的平均值。公式#xff1a; ( M S E 1 n ∑ i 1 n ( y i − y ^ i ) 2 ) (MSE \frac{1}{n}\sum_{i1}^{n}(y_i - \hat{y}_i)^2) (MSEn1∑i1n(yi−y^i)…评价指标
均方误差 M S E MSE MSE
定义预测值与实际值之间差异的平方和的平均值。公式 ( M S E 1 n ∑ i 1 n ( y i − y ^ i ) 2 ) (MSE \frac{1}{n}\sum_{i1}^{n}(y_i - \hat{y}_i)^2) (MSEn1∑i1n(yi−y^i)2) 其中 ( y i ) (y_i) (yi)是实际值 ( y ^ i ) (\hat{y}_i) (y^i) 是预测值 ( n ) (n) (n) 是样本数量。特点 M S E MSE MSE是最常用的评价指标之一它直接反映了预测误差的大小。然而 M S E MSE MSE对异常值比较敏感。
平均绝对误差 M A E MAE MAE
定义预测值与实际值之间差异的绝对值的平均值。公式 ( M A E 1 n ∑ i 1 n ∣ y i − y ^ i ∣ ) (MAE \frac{1}{n}\sum_{i1}^{n}|y_i - \hat{y}_i|) (MAEn1∑i1n∣yi−y^i∣)特点与 M S E MSE MSE相比 M A E MAE MAE对异常值不敏感。但是 M A E MAE MAE没有考虑误差的平方可能会低估误差的大小。
平均绝对百分比误差 M A P E MAPE MAPE
定义预测值与实际值之间差异的绝对值与实际值的比值的平均值。公式 ( M A P E 1 n ∑ i 1 n ∣ y i − y ^ i y i ∣ × 100 (MAPE \frac{1}{n}\sum_{i1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right| \times 100%) (MAPEn1∑i1n yiyi−y^i ×100注意当实际值为 0 0 0时 M A P E MAPE MAPE无法计算特点 M A P E MAPE MAPE考虑了实际值的大小可以帮助评估模型的相对误差。但是对于含有零值的数据集 M A P E MAPE MAPE可能不适用。
均方根误差 R M S E RMSE RMSE
定义均方误差的平方根。公式 ( R M S E 1 n ∑ i 1 n ( y i − y ^ i ) 2 ) (RMSE \sqrt{\frac{1}{n}\sum_{i1}^{n}(y_i - \hat{y}_i)^2}) (RMSEn1∑i1n(yi−y^i)2 )特点 R M S E RMSE RMSE与 M S E MSE MSE类似但它与实际值的单位相同因此更加直观。然而 R M S E RMSE RMSE同样对异常值敏感。
决定系数R-squared通常表示为( R 2 R^2 R2)
是回归分析中用于量化模型预测能力的一个统计量。它表示模型中自变量对因变量变化的解释程度即模型能够解释的因变量变异的比例。 定义 决定系数( R 2 R^2 R2)的范围在 0 0 0到 1 1 1之间其中
( R 2 1 R^2 1 R21)表示模型完美地拟合了数据即所有的观测点都落在回归线上。
( R 2 0 R^2 0 R20)表示模型没有解释任何因变量的变异模型的预测值与观测值的平均值没有区别。
( 0 R 2 1 0 R^2 1 0R21)表示模型解释了部分但非全部的因变量变异。
计算方法
R 2 1 − ∑ i 1 n ( y i − y ^ i ) 2 ∑ i 1 n ( y i − y ˉ ) 2 R^2 1 - \frac{\sum_{i1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i1}^{n} (y_i - \bar{y})^2} R21−∑i1n(yi−yˉ)2∑i1n(yi−y^i)2
其中
( Sum of Squared Residuals (SSR) \text{Sum of Squared Residuals (SSR)} Sum of Squared Residuals (SSR)) 是预测值与实际值之差的平方和也称为残差平方和 R e s i d u a l S u m o f S q u a r e s R S S Residual Sum of SquaresRSS ResidualSumofSquaresRSS。
( Total Sum of Squares (SST) \text{Total Sum of Squares (SST)} Total Sum of Squares (SST)) 是因变量实际值与其均值之差的平方和也称为总平方和 T o t a l S u m o f S q u a r e s T S S Total Sum of SquaresTSS TotalSumofSquaresTSS。
解释
( R 2 R^2 R2)值越接近 1 1 1说明模型的拟合效果越好能够解释的因变量变异比例越高。但是也需要注意以下几点
( R 2 R^2 R2)的增加不一定意味着模型预测能力的实质性提高。在某些情况下简单地增加模型中的变量 数量即使这些变量与因变量没有真正的关联也可能导致( R 2 R^2 R2)的增加但这并不意味着模型的 实际预测能力有所提高。因此需要谨慎地解释和比较不同模型的( R 2 R^2 R2)值。
( R 2 R^2 R2)值也受样本大小的影响。在样本量很大时即使很小的效应也可能导致较高的(R^2)值。因 此在比较不同数据集上的模型时需要考虑到这一点。
在某些情况下即使( R 2 R^2 R2)值较低模型也可能具有实际预测价值。特别是在处理具有复杂非线性 关系或存在大量随机噪声的数据时很难达到很高的( R 2 R^2 R2)值。因此在评估模型时还需要考虑 其他因素如模型的稳健性、可解释性等。