当前位置: 首页 > news >正文

网站怎么换主机wordpress鼠标

网站怎么换主机,wordpress鼠标,如何优化啊里网站排名,网站建设功能解说非线性回归是一种用于模拟变量之间复杂关系的强大工具。然而#xff0c;离群值的存在可能会显着扭曲结果#xff0c;导致参数估计不准确和预测不可靠。因此#xff0c;检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术离群值的存在可能会显着扭曲结果导致参数估计不准确和预测不可靠。因此检测离群值对于稳健的非线性回归分析至关重要。本文深入研究了在非线性回归中识别离群值的方法和技术确保您获得可靠和准确的结果。 了解非线性回归 什么是非线性回归 非线性回归是回归分析的一种形式其中观测数据由模型参数的非线性组合函数建模并取决于一个或多个自变量。与线性回归不同它假设变量之间的直线关系非线性回归可以模拟更复杂的关系。 离群值检测的重要性 离群值是指显著偏离数据总体模式的数据点。在非线性回归的背景下离群值可能对模型产生不成比例的影响导致有偏的参数估计和较差的预测性能。检测和适当处理离群值对于保持回归分析的完整性至关重要。 非线性回归中离群值的检测方法 1.目视检查 散点图散点图是直观检查数据是否存在潜在离群值的简单而有效的方法。通过绘制因变量与自变量的关系图您可以确定与预期关系相差甚远的点。残差图残差图显示相对于自变量或拟合值的残差观测值和预测值之间的差异。离群值通常表现为具有较大残差的点这些点与其余数据显著偏离。 2.统计方法 学生化残差学生化残差是残差除以其标准差的估计值。它们遵循t分布从而更容易识别离群值。具有大于特定阈值的学生化残差的点例如2或3被认为是离群值。Cook距离Cook距离测量每个数据点对拟合值的影响。Cook距离大于特定阈值通常为4/n其中n为数据点数量的点被视为有影响力和潜在离群值。Hadi’s PotentialHadi’s Potential是一种结合杠杆和残差来识别影响点的度量。它在非线性回归中特别有用其中单独的杠杆可能不足以检测离群值。 3.鲁棒回归方法 最小绝对偏差LAD最小绝对偏差最小化绝对残差之和而不是残差平方之和。该方法对离群值不太敏感并提供了普通最小二乘OLS回归的稳健替代方案。M-估计M-估计通过使用减少离群值影响的损失函数来推广最大似然估计。常用的M估计量包括Huber’s T和Tukey’s Bigweight。最小二乘LTS最小二乘回归最小化最小平方残差的总和有效地忽略了可能由于离群值引起的最大残差。该方法在存在离群值的情况下提供稳健的参数估计。 非线性回归检测离群值实例 步骤1 导入相关模块库 import numpy as np import pandas as pd import statsmodels.api as sm import statsmodels.formula.api as smf import matplotlib.pyplot as plt import seaborn as sns from statsmodels.robust.robust_linear_model import RLM from statsmodels.robust.norms import HuberT, LeastSquares from sklearn.metrics import mean_squared_error步骤2 创建随机数据集 n 100 x np.linspace(0, 10, n) y 2.5 * np.sin(1.5 * x) np.random.normal(0, 0.5, n) # Adding some outliers x_outliers np.append(x, [1, 2, 3]) y_outliers np.append(y, [10, -10, 12]) data pd.DataFrame({tumor_size: x_outliers, metastasis_fraction: y_outliers})步骤3使用普通最小二乘回归拟合非线性模型 # Adding a nonlinear term for the regression model data[tumor_size_squared] data[tumor_size] ** 2 ols_model smf.ols(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit()步骤4可视化数据 plt.figure(figsize(12, 6)) plt.subplot(1, 2, 1) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) plt.plot(data[tumor_size], ols_model.fittedvalues, colorred) plt.title(Scatter Plot with OLS Fit)plt.subplot(1, 2, 2) sns.residplot(xols_model.fittedvalues, yols_model.resid) plt.title(Residual Plot) plt.show() 步骤5应用于回归模型 # Robust regression using Least Absolute Deviations (LAD) lad_model smf.quantreg(metastasis_fraction ~ tumor_size tumor_size_squared, datadata).fit(q0.5)# Robust regression using M-Estimation with HuberT norm rlm_huber RLM(data[metastasis_fraction], sm.add_constant(data[[tumor_size, tumor_size_squared]]), MHuberT()).fit()步骤6使用统计方法识别离群值 # Studentized Residuals data[studentized_residuals] ols_model.get_influence().resid_studentized_internal# Cooks Distance data[cooks_distance] ols_model.get_influence().cooks_distance[0]# Hadis Potential (not directly available in statsmodels, so we use an approximation) data[leverage] ols_model.get_influence().hat_matrix_diag# Mark potential outliers outlier_indices data[(np.abs(data[studentized_residuals]) 2) | (data[cooks_distance] 4/(n-2)) | (data[leverage] 0.2)].index outliers data.loc[outlier_indices]步骤7比较不同方法的结果 # OLS model print(OLS Model Summary:) print(ols_model.summary())# LAD model print(\nLAD Model Summary:) print(lad_model.summary())# RLM model with HuberT norm print(\nRLM Model (HuberT) Summary:) print(rlm_huber.summary())# Goodness-of-fit measures print(\nGoodness-of-Fit Measures:) print(fOLS Mean Squared Error: {mean_squared_error(data[metastasis_fraction], ols_model.fittedvalues)}) print(fLAD Mean Squared Error: {mean_squared_error(data[metastasis_fraction], lad_model.fittedvalues)}) print(fRLM (HuberT) Mean Squared Error: {mean_squared_error(data[metastasis_fraction], rlm_huber.fittedvalues)})# Plotting the outliers plt.figure(figsize(12, 6)) sns.scatterplot(xtumor_size, ymetastasis_fraction, datadata) sns.scatterplot(xtumor_size, ymetastasis_fraction, dataoutliers, colorred) plt.title(Scatter Plot with Outliers Highlighted) plt.show()输出 OLS Model Summary:OLS Regression Results Dep. Variable: metastasis_fraction R-squared: 0.125 Model: OLS Adj. R-squared: 0.107 Method: Least Squares F-statistic: 7.134 Date: Tue, 30 Jul 2024 Prob (F-statistic): 0.00127 Time: 21:15:45 Log-Likelihood: -237.57 No. Observations: 103 AIC: 481.1 Df Residuals: 100 BIC: 489.0 Df Model: 2 Covariance Type: nonrobust coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 2.6754 0.709 3.772 0.000 1.268 4.083 tumor_size -1.2510 0.332 -3.769 0.000 -1.910 -0.593 tumor_size_squared 0.1196 0.032 3.712 0.000 0.056 0.183Omnibus: 35.806 Durbin-Watson: 1.658 Prob(Omnibus): 0.000 Jarque-Bera (JB): 299.629 Skew: 0.732 Prob(JB): 8.64e-66 Kurtosis: 11.226 Cond. No. 142. Notes: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified.LAD Model Summary:QuantReg Regression Results Dep. Variable: metastasis_fraction Pseudo R-squared: 0.1515 Model: QuantReg Bandwidth: 2.178 Method: Least Squares Sparsity: 5.458 Date: Tue, 30 Jul 2024 No. Observations: 103 Time: 21:15:45 Df Residuals: 100Df Model: 2 coef std err t P|t| [0.025 0.975] -------------------------------------------------------------------------------------- Intercept 3.0050 0.785 3.828 0.000 1.447 4.563 tumor_size -1.6699 0.367 -4.545 0.000 -2.399 -0.941 tumor_size_squared 0.1686 0.036 4.729 0.000 0.098 0.239 RLM Model (HuberT) Summary:Robust linear Model Regression Results Dep. Variable: metastasis_fraction No. Observations: 103 Model: RLM Df Residuals: 100 Method: IRLS Df Model: 2 Norm: HuberT Scale Est.: mad Cov Type: H1 Date: Tue, 30 Jul 2024 Time: 21:15:45 No. Iterations: 11 coef std err z P|z| [0.025 0.975] -------------------------------------------------------------------------------------- const 2.5250 0.540 4.674 0.000 1.466 3.584 tumor_size -1.2436 0.253 -4.919 0.000 -1.739 -0.748 tumor_size_squared 0.1208 0.025 4.923 0.000 0.073 0.169 If the model instance has been used for another fit with different fit parameters, then the fit options might not be the correct ones anymore .Goodness-of-Fit Measures: OLS Mean Squared Error: 5.900980188225848 LAD Mean Squared Error: 6.09596526991115 RLM (HuberT) Mean Squared Error: 5.909805102901932总结 离群值检测是非线性回归分析的一个重要内容。通过采用目视检查统计方法和鲁棒的回归技术相结合研究人员可以确保准确可靠的参数估计。使用先进的方法如ROUT方法和蒙特卡罗模拟能进一步提高了分析的鲁棒性。正确处理离群值会产生更值得信赖的模型和更好的基于数据的决策。
http://www.hkea.cn/news/14509252/

相关文章:

  • 做废铁在哪个网站推广中卫网站推广优化
  • 开源的网站系统wordpress布局怎么看
  • 网站建设视频代码wordpress怎么添加全局背景音乐
  • python 网站开发实战wordpress 手机版 导航
  • 淘宝网站所用编码群晖 套件 wordpress
  • 做微信公众号用什么网站老板办公室装修设计
  • 网站托管怎做什么学做网站
  • 免费网站备案号码wordpress七牛云使用
  • 网页制作怎么上传到网站wordpress 去掉 googleapis
  • 企业网站可以自己做北京网站建设seo优化
  • 做蛋糕网站的优点免费 支付宝购物网站模版
  • 服装设计网站有哪些推荐关于购物网站开发的开题报告
  • 长沙网站推广服务公司ui培训班有用吗
  • 长沙做企业网站推广的公司外贸网站建设源码
  • python做音乐网站网站建设用电脑
  • 镇海建设交通局网站首页东莞横沥理工学校
  • yahoo网站提交入口微擎可以做网站吗
  • 品牌商城网站制作考研门户网站的建设
  • 用php做京东网站页面flarum wordpress
  • 中学生做的安全作业网站波莱网站开发
  • wordpress多站点使用期限插件公司展示网站制作
  • 家乡ppt模板免费下载网站短视频运营培训学校
  • 网站tag聚合怎么做什么类型的公司需要做建设网站的
  • 阳江市网站建设宿迁定制网站建设
  • 北京网络网站建设价格低外包服务属于什么行业
  • 网上做的比较好的竞彩网站小偷程序做的网站能用吗
  • 东莞快速建站平台如何建设机关用房管理系统网站
  • 网站建设商业营销技巧五步推销法
  • 如何建设网页游戏网站青岛网站建设微信群
  • 织梦搭建企业网站南京网站制作哪家专业