当前位置: 首页 > news >正文

div css网站实例百度关键词价格查询软件

div css网站实例,百度关键词价格查询软件,WordPress文章收录,自建网站h5Facebook_location_KNN 流程分析: 1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?) 2.基本数据处理(数据选取-确定特征值和目标值-分割数据集) 缩小数据范围 选择时间特征 去掉签到较少的地方 确定特征值和目标值 分割数据集 3.特征工程(特征预处理:标…

Facebook_location_KNN

流程分析:

1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?)

2.基本数据处理(数据选取-确定特征值和目标值-分割数据集)

缩小数据范围

选择时间特征

去掉签到较少的地方

确定特征值和目标值

分割数据集

3.特征工程(特征预处理:标准化)

4.模型训练(KNN+CV)

5.模型评估

代码实现基本步骤

1.数据导入

1.1导入facebook_location_train_set(数据集大小:1.8G), 需要加载一段时间

import pandas as pd
locdata=pd.read_csv(r"C:\Users\鹰\Desktop\ML_Set\FaceBook_train.csv\FaceBook_train.csv")

1.2对数据的信息的简单分析

显示部分数据

locdata.head()

查看数据描述

locdata.describe()

查看数据行列数

locdata.shape

2.数据基本处理

2.1缺失值处理

print(“查看数据缺失值:”)
print(locdata.isna().sum())
locdata.dropna()
print(locdata.isna().sum())

2.2数据提取

缩小数据范围

locdata= locdata.query(“x>2.0 & x<2.5 & y>2.0 & y<2.5”)

选择时间特征, 对time进行转化

time=pd.to_datetime(locdata[“time”], unit=“s”)
time=pd.DatetimeIndex(time)
locdata[“day”]=time.day
locdata[“hour”]=time.hour
locdata[“weekday”]=time.weekday

去掉签到较少的地方, 在这里去掉签到次数小于三的地点

place_set= locdata.groupby(“place_id”).count()
place_set= place_set[place_set[“row_id”]>3]
locdata=locdata[locdata[“place_id”].isin(place_set.index)]

确定目标值和特征值, 用loc和iloc可以吗? 有什么区别吗?

x_all=locdata[[“x”,“y”,“accuracy”,“day”,“hour”,“weekday”]]
y_all=locdata[“place_id”]####

2.3数据集分割

from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test=train_test_split(x_all, y_all,test_size=0.2)###
print(x_train)
print(x_test)
print(y_train)
print(y_test)

3.特征工程

3.1特征预处理-标准化

from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
x_train=scaler.fit_transform(x_train)
x_test=scaler.fit_transform(x_test)

4.模型训练-KNN+CV

4.1KNN调用

from sklearn.neighbors import KNeighborsClassifier
estimator=KNeighborsClassifier()

4.2模型优化

from sklearn.model_selection import GridSearchCV
params={“n_neighbors”:[1,3,5,7,9]}
estimator=GridSearchCV(estimator, param_grid=params, cv=5)

4.3模型训练

estimator.fit(x_train, y_train)

5.模型评估

5.1预测值

y_predict=estimator.predict(x_test)
print(“预测值为:”, y_predict)

5.2准确率

score=estimator.score(x_test,y_test)
print(“准确率为:”, score)

5.2最优模型参数:

print(“最优模型为:”, estimator.best_estimator_)

5.3最好评分

print(“最高分:”, estimator.best_score_)

数据集Facebook_Location下载地址:

链接:https://pan.baidu.com/s/1uoeo6pukkjSuLlKW9RwnCQ
提取码:7hlo

http://www.hkea.cn/news/136436/

相关文章:

  • wordpress内网访问泰州百度关键词优化
  • 做淘客网站用备案网络营销计划书怎么写
  • 网站 公安 备案深圳百度推广客服电话多少
  • 北京米兰广告设计有限公司广州优化疫情防控举措
  • 汕头个人建站模板网站推广计划方法
  • php企业网站无限制源码网络营销方案设计
  • 动漫网站开发与建设百度网盘网页版入口官网
  • 咸阳做网站长沙网络营销外包哪家好
  • 专门做私人定制旅游的网站搜索引擎营销方法
  • 注册安全工程师管理系统网奇seo赚钱培训
  • 武汉市住房和城乡建设厅官方网站生猪价格今日猪价
  • 住房和城乡建设部网站诚信评价搜索引擎优化人员优化
  • 网站制作 太原网络营销专业课程
  • 做网站去哪个公司网络营销策划书的结构
  • 个人无网站怎样做cps广告深圳全网推广公司
  • 中国人可以做的c2c网站上海网站排名推广
  • 网站建设目标定位公司员工培训方案
  • 美工培训班学百度自然搜索排名优化
  • 网站建设自学多长时间搜索引擎营销的过程
  • 做cpa的网站源码seo的外链平台有哪些
  • 那个网站做外贸最好成都网站建设方案外包
  • 企业网站建设效益分析联合早报 即时消息
  • html5网页成品代码自媒体seo优化
  • 门户网站建设招投标网络seo啥意思
  • 游戏币销售网站建设百度热搜seo
  • 线上投票链接怎么做厦门搜索引擎优化
  • 网页设计课程主要内容seo学校
  • php 深圳 电子商务网站开发seo优化好做吗
  • 网站建设开发技术天津济南网站设计
  • 信息公开网站建设网店推广分为哪几种类型