当前位置: 首页 > news >正文

松江新城做网站公司互联网设计师前景如何

松江新城做网站公司,互联网设计师前景如何,建设工程合同无效的情形有哪些,百度指数名词解释目录 倾向加权 倾向得分估计 倾向加权 好的#xff0c;我们得到了倾向得分。怎么办#xff1f;就像我说过的#xff0c;我们需要做的就是以此为条件。例如#xff0c;我们可以运行一个线性回归#xff0c;它仅以倾向得分为条件#xff0c;而不是所有的 X。现在#xff…目录 倾向加权 倾向得分估计 倾向加权 好的我们得到了倾向得分。怎么办就像我说过的我们需要做的就是以此为条件。例如我们可以运行一个线性回归它仅以倾向得分为条件而不是所有的 X。现在让我们看一下只使用倾向得分而不使用其他任何东西的技术。这个想法是用倾向得分写出均值的条件差 我们可以进一步简化这一点但让我们这样看一下因为它让我们对倾向得分的作用有了一些很好的直觉。第一项是估计 Y1。它应用于所有接受干预的对象并按接受干预的逆概率对它们的权重进行缩放。这样做的目的是使那些接受干预的可能性非常低的人权重增加。想想看这是有道理的对吧如果某人接受干预的可能性很低那么该人看起来就像未经干预的人。然而同一个人受到了干预。这一定很有趣。我们有一个看起来像未经干预的被干预对象因此我们将给予该实体较高的权重。这样做的目的是创建一个与原始全样本相同大小的群体但每个人都受到干预。出于同样的原因另一个术语着眼于未经干预的人并赋予那些看起来像经过干预的人很高的权重。这个估计器被称为干预加权的逆概率IPTW因为它通过接受除它所接受的干预之外的某种其他影响的概率来缩放每个单元的权重。 在下面在图片中就展示了这种加权的作用。 左上图显示了原始数据。蓝点是未干预的红点是干预过的。底部图显示了倾向得分 P(x)。注意它是如何在 0 和 1 之间的并且随着 X 的增加而增长。最后右上图是加权后的数据。注意更靠左的红色处理过的倾向得分较低的权重更高。同样右侧的蓝色图也具有更高的权重。现在我们有了直觉我们可以将上面的术语简化为如果我们对 X 进行积分它就会成为我们的倾向得分加权估计量。 请注意此估计器要求 P(x) 和 1−P(x)  大于零。换句话说这意味着每个人都需要至少有一些机会接受干预和不接受干预。说明这一点的另一种方式是干预和未干预样本的分布需要重叠。这是因果推理的正值假设positivity assumption。它也具有直觉意义。如果干预和未干预的样本不重叠这意味着它们非常不同我将无法将一组的效果外推到另一组。这种推断并非不可能回归做到了但它非常危险。这就像在实验中测试一种新药只有男性接受治疗然后假设女性对它的反应同样好。 倾向得分估计 在一个理想的世界中我们会有真实的倾向得分P(X)。 然而在实践中分配干预的机制是未知的我们需要用对它的估计来替换真实的倾向得分 。 这样做的一种常见方法是使用逻辑回归但也可以使用其他机器学习方法如梯度提升尽管它需要一些额外的步骤来避免过度拟合。 在这里我将坚持逻辑回归。 这意味着我必须将数据集中的分类特征转换为假人。 categ [ethnicity, gender, school_urbanicity] cont [school_mindset, school_achievement, school_ethnic_minority, school_poverty, school_size]data_with_categ pd.concat([data.drop(columnscateg), # dataset without the categorical featurespd.get_dummies(data[categ], columnscateg, drop_firstFalse)# categorical features converted to dummies ], axis1)print(data_with_categ.shape)(10391, 32) 现在让我们使用逻辑回归logistic regression来估计倾向得分。 from sklearn.linear_model import LogisticRegressionT intervention Y achievement_score X data_with_categ.columns.drop([schoolid, T, Y])ps_model LogisticRegression(C1e6).fit(data_with_categ[X], data_with_categ[T])data_ps data.assign(propensity_scoreps_model.predict_proba(data_with_categ[X])[:, 1])data_ps[[intervention, achievement_score, propensity_score]].head() 首先我们可以确保倾向得分权重确实重建了每个人都得到干预的人群。 通过产生权重1/P(X)它创建了每个人都被对待的群体并通过提供权重1/(1−P(X))它创建了群体其中 每个人都没有得到干预。 weight_t 1/data_ps.query(intervention1)[propensity_score] weight_nt 1/(1-data_ps.query(intervention0)[propensity_score]) print(Original Sample Size, data.shape[0]) print(Treated Population Sample Size, sum(weight_t)) print(Untreated Population Sample Size, sum(weight_nt)) Original Sample Size 10391 Treated Population Sample Size 10388.604824722199 Untreated Population Sample Size 10391.4305248224我们还可以使用倾向得分来找到混淆的证据。 如果人群中的一个细分群体的倾向得分高于另一个群体这意味着不是随机的东西导致了干预。 如果同样的事情也导致了结果我们就会感到困惑。 在我们的案例中我们可以看到自称更有野心的学生也更有可能参加成长心态研讨会。 sns.boxplot(xsuccess_expect, ypropensity_score, datadata_ps) plt.title(Confounding Evidence); 我们还必须检查干预和未干预人群之间是否存在重叠。 为此我们可以看到倾向得分在未干预者和被干预者上的经验分布。 查看下图我们可以看到没有人的倾向得分为零即使在倾向得分较低的区域我们也可以找到接受干预和未接受干预的个体。 这就是我们所说的经过良好平衡的干预和未干预人群。 sns.distplot(data_ps.query(intervention0)[propensity_score], kdeFalse, labelNon Treated) sns.distplot(data_ps.query(intervention1)[propensity_score], kdeFalse, labelTreated) plt.title(Positivity Check) plt.legend(); 最后我们可以使用倾向得分加权估计器来估计平均干预效果ATE。 weight ((data_ps[intervention]-data_ps[propensity_score]) /(data_ps[propensity_score]*(1-data_ps[propensity_score])))y1 sum(data_ps.query(intervention1)[achievement_score]*weight_t) / len(data) y0 sum(data_ps.query(intervention0)[achievement_score]*weight_nt) / len(data)ate np.mean(weight * data_ps[achievement_score])print(Y1:, y1) print(Y0:, y0) print(ATE, np.mean(weight * data_ps[achievement_score])) Y1: 0.2595774244866067 Y0: -0.12892090981713242 ATE 0.38849833430373715倾向得分加权表示就成就而言我们应该期望接受干预的个体比未经干预的同伴高 0.38 个标准差。 我们还可以看到如果没有人得到干预我们应该期望成绩的总体水平比现在低 0.12 个标准差。 同样的道理如果我们为每个人提供研讨会我们应该期望一般成就水平高出 0.25 个标准差。 将此与我们通过简单比较干预和未干预得到的 0.47 ATE 估计值进行对比。 这证明我们的偏差确实是正向的并且控制 X 让我们对成长心态的影响有了更适度的估计。
http://www.hkea.cn/news/14528733/

相关文章:

  • 网站遮罩是什么程序员 做网站 微信公众号 赚钱
  • 外国人 做的中国字网站上海建设网站公司哪家好
  • 宝安专业网站设计公司新都有没有做网站的
  • 深圳网页制作与网站建设方案维护加强网站信息建设管理
  • 网站数据库安全国内做免费视频网站有哪些
  • 网站开发 都包含什么语言外国人 做的中国字网站
  • 做网站的说3年3年包括什么软件首页关键词排名
  • 网站首页默认的文件名一般为企业网上年审营业执照
  • 找工作的网站有哪些?wordpress如何应用ssl
  • 如何做推广网站分类信息导航网站模板
  • 如何做网站推广优化四会市网站建设
  • 一流的龙岗网站设计网络营销策划的内容
  • 营销型科技网站如何拷贝网站代码
  • 江山企业自适应网站建设首选网店代运营公司方案
  • 机关单位不得建设网站新公司董事长致辞做网站
  • 产权交易中心网站建设的原因门户网站建设公司哪家好
  • 洛阳建设企业网站公司推荐几个好看的网站
  • 足球最新世界排名表扬州seo博客
  • 网站建设等级定级甘肃省住房和城乡建设局网站首页
  • 长沙专业网站建设公司长沙一键建站系统
  • 在线网站建设中企做一个网站多少钱
  • 外贸社交营销代运营seo搜索引擎优化工资多少钱
  • 做网站文字编辑工作好不好自己怎么建立网站
  • 网站建设答辩ppt下载wordpress登陆页插件面
  • 网站名 注册建设商场黄金网站
  • 企业网站建设 企业官网定制网络及it维护外包
  • 手袋 技术支持 东莞网站建设广州网站制作工作室
  • 安卓网站开发网络空间的竞争归根结底是
  • python 网站建设 拖拽式养殖网站源码
  • 个人网站模板html下载深圳外贸网站设计公司