当前位置: 首页 > news >正文

做营销型网站公司wordpress redis自动

做营销型网站公司,wordpress redis自动,俄语搜索网站,青岛的公司DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli… DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseline换为lightgbm基线不加任何特征线上得分0.52214 添加baseline特征线上得分0.78176 暴力衍生特征并微调模型参数线上得分0.86068 2023.08.23 数据分析、衍生特征0.87488 衍生特征、模型调参0.89817 交流分享视频 【DataWhale“用户新增预测挑战赛”交流分享-哔哩哔哩】 https://b23.tv/zZMLtFG 1.赛题理解 这次比赛特征主要可以分为以下三个维度 行为维度eid、udmap udmap的key处理成了类别特征 时间维度common_ts 进行了时间戳特征的提取day, hour, minute 用户维度x1~x8 2. 数据可视化分析 使用以下代码绘制前还需做一些设置具体可以参考如下链接 https://www.kaggle.com/code/jcaliz/ps-s03e02-a-complete-eda/notebook 该notebook内提供了丰富的可视化分析代码和思路值得参考。 绘制代码 def plot_cate_large(col):data_to_plot (all_df.groupby(set)[col].value_counts(True)*100)fig, ax plt.subplots(figsize(10, 6))sns.barplot(datadata_to_plot.rename(Percent).reset_index(),hueset, xcol, yPercent, axax,orientv,hue_order[train, test])x_ticklabels [x.get_text() for x in ax.get_xticklabels()]# Secondary axis to show mean of targetax2 ax.twinx()scatter_data all_df.groupby(col)[target].mean()scatter_data.index scatter_data.index.astype(str)ax2.plot(x_ticklabels,scatter_data.loc[x_ticklabels],linestyle, marker., colorcolors[4],markersize15)ax2.set_ylim([0, 1])# Set x-axis tick labels every 5th valuex_ticks_indices range(0, len(x_ticklabels), 5)ax.set_xticks(x_ticks_indices)ax.set_xticklabels(x_ticklabels[::5], rotation45, haright)# titlesax.set_title(f{col})ax.set_ylabel(Percent)ax.set_xlabel(col)# remove axes to show only one at the endhandles []labels []if ax.get_legend() is not None:handles ax.get_legend().legendHandleslabels [x.get_text() for x in ax.get_legend().get_texts()]else:handles ax.get_legend_handles_labels()[0]labels ax.get_legend_handles_labels()[1]ax.legend().remove()plt.legend(handles, labels, locupper center, bbox_to_anchor(0.5, 1.08), fontsize12)plt.tight_layout()plt.show() 2.1 用户维度特征分布分析 可视化分析说明 研究离散变量[eid, x3, x4, x5‘,x1, x2, x6,x7, x8]的分布蓝色是训练集黄色是验证集分布基本一致粉色的点是训练集下每个类别每种取值的target的均值也就是target1的占比 该图主要分析类别数较少的离散变量 训练集和测试集分布比较均匀x1主要集中在 x14 x2分布比较均匀x6基本集中在1和4两个值x7分布比较均匀可能是一个关键特征x8可能是性别特征特征重要性较低udmap_key为提取出的特征存在缺失值 x3主要集中在41下占比太大特征重要性很低 x4中各个类别下target的分布变化较大可能是一个关键特征 x5中各个类别同x4,target的分布变化较大可能是一个关键特征但特征数量太多在衍生特征时需要注意避免产生稀疏性 2.2 时间特征分布分析 主要绘制了common_ts中 day 和 hour 的变化情况 day的值和用户增长有很大的关系可以发现在10、14和17新用户有明显的增长老用户对应也呈现出增长趋势 绘制了从day10到day18的新老用户变化情况新老用户的数量在每天的各个时间段呈现基本相同的趋势进一步观察原始数据可以发现三个峰的出现是因为在该三个时间段数据量较其他时间段多可以进一步绘制出各个时间段人数占全天人数的占比图来进一步分析数据
http://www.hkea.cn/news/14459282/

相关文章:

  • 邢台做网站推广的公司是哪家?详情页设计策划
  • 沪浙网站惠州seo计费
  • 网站ip如何做跳转重庆百度seo
  • 企业网站开发要学什么论坛型网站 建站
  • 和动物做的网站wordpress 开源吗
  • 家具网站建设案例网络工程就业方向及前景
  • 开发一个手机网站要多少钱个人网站怎么建设步骤
  • 广州市网站建设京东网站设计分析
  • 咋么做网站上海app开发公司排名
  • 哪有做机械设计的网站虚拟机做的网站怎么让外网访问不了网
  • 网站建网站建设seo帮帮您网站在谷歌怎么做排名
  • 深圳梵高网站建设服务学做网站的书哪些好
  • 怎么建设自己的论坛网站dede网站错位
  • 洛阳直播网站建设宣传推广的作用
  • 专业做网站建设设计做网站设计需要多久
  • 网站建设要代码有什么好处张家界网络
  • 网站app制作wordpress媒体文件隔离
  • 宝安网站开发微信支付wordpress
  • 网站建设工程师培训电子商务网站开发分几个模块
  • 自己做的网站如何让qq登录做竞价的网站
  • 做网站怎么样网站采用什么字体
  • 织梦大气婚纱影楼网站源码网站模板资源
  • 网站系统模版自己怎么做企业网站建设
  • 网站建设页面图住房和城乡建设部网站政策发布
  • 上海高端定制网站公司公司邮箱价格
  • 吉林省软环境建设网站瑞安市公用建设局网站
  • 免费网站建设加盟校园在线网站怎么做
  • 浙江省永康市建设局网站进不去域名注册以后怎样做网站
  • 咖啡店网站模板创建吃的网站怎么做
  • 百度seo整站优化微信登录wordpress