哈尔滨模板自助建站,做外贸的物流网站,莱州网络推广公司,做电商网站微信号是多少记录下每一次的改进及其score。
1、只用训练集的特征简单处理
特征只用训练集的特征#xff0c;把string型的特征全部进行one-hot转化#xff0c;然后随机1:4分成测试集训练集#xff0c;模型也调参直接出结果。
最终的score是训练集80.13%、验证集76.33%、线上74.28%。 …记录下每一次的改进及其score。
1、只用训练集的特征简单处理
特征只用训练集的特征把string型的特征全部进行one-hot转化然后随机1:4分成测试集训练集模型也调参直接出结果。
最终的score是训练集80.13%、验证集76.33%、线上74.28%。
实验2SK_ID_CURR作为唯一的ID特征重要性能排在第12位? 处理方法做个消融实验去掉这个特征80.44%、75.82%、74.62%。 结论虽然训练集auc相比上一次实验下降了0.51pt但是线上score却增加了0.34pt可见虽然SK_ID_CURR的特征重要性较高但对模型的泛化性有负向作用。
实验3很多flag特征也被当做string类型进行了one-hot处理导致其实是两个一样的特征? 处理方法在做特征one-hot的时候去掉一个特征。81.66、76.08、74.42%。
实验下来差异都没什么增益明天增加bureau的数据试试。