当前位置: 首页 > news >正文

网站 公安局备案seo教程下载

网站 公安局备案,seo教程下载,国外免费舆情网站有哪些软件,cdr做网站Facebook_location_KNN 流程分析: 1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?) 2.基本数据处理(数据选取-确定特征值和目标值-分割数据集) 缩小数据范围 选择时间特征 去掉签到较少的地方 确定特征值和目标值 分割数据集 3.特征工程(特征预处理:标…

Facebook_location_KNN

流程分析:

1.数据集获取(大型数据怎么获取? 放在电脑哪里? 算力怎么搞?)

2.基本数据处理(数据选取-确定特征值和目标值-分割数据集)

缩小数据范围

选择时间特征

去掉签到较少的地方

确定特征值和目标值

分割数据集

3.特征工程(特征预处理:标准化)

4.模型训练(KNN+CV)

5.模型评估

代码实现基本步骤

1.数据导入

1.1导入facebook_location_train_set(数据集大小:1.8G), 需要加载一段时间

import pandas as pd
locdata=pd.read_csv(r"C:\Users\鹰\Desktop\ML_Set\FaceBook_train.csv\FaceBook_train.csv")

1.2对数据的信息的简单分析

显示部分数据

locdata.head()

查看数据描述

locdata.describe()

查看数据行列数

locdata.shape

2.数据基本处理

2.1缺失值处理

print(“查看数据缺失值:”)
print(locdata.isna().sum())
locdata.dropna()
print(locdata.isna().sum())

2.2数据提取

缩小数据范围

locdata= locdata.query(“x>2.0 & x<2.5 & y>2.0 & y<2.5”)

选择时间特征, 对time进行转化

time=pd.to_datetime(locdata[“time”], unit=“s”)
time=pd.DatetimeIndex(time)
locdata[“day”]=time.day
locdata[“hour”]=time.hour
locdata[“weekday”]=time.weekday

去掉签到较少的地方, 在这里去掉签到次数小于三的地点

place_set= locdata.groupby(“place_id”).count()
place_set= place_set[place_set[“row_id”]>3]
locdata=locdata[locdata[“place_id”].isin(place_set.index)]

确定目标值和特征值, 用loc和iloc可以吗? 有什么区别吗?

x_all=locdata[[“x”,“y”,“accuracy”,“day”,“hour”,“weekday”]]
y_all=locdata[“place_id”]####

2.3数据集分割

from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test=train_test_split(x_all, y_all,test_size=0.2)###
print(x_train)
print(x_test)
print(y_train)
print(y_test)

3.特征工程

3.1特征预处理-标准化

from sklearn.preprocessing import StandardScaler
scaler=StandardScaler()
x_train=scaler.fit_transform(x_train)
x_test=scaler.fit_transform(x_test)

4.模型训练-KNN+CV

4.1KNN调用

from sklearn.neighbors import KNeighborsClassifier
estimator=KNeighborsClassifier()

4.2模型优化

from sklearn.model_selection import GridSearchCV
params={“n_neighbors”:[1,3,5,7,9]}
estimator=GridSearchCV(estimator, param_grid=params, cv=5)

4.3模型训练

estimator.fit(x_train, y_train)

5.模型评估

5.1预测值

y_predict=estimator.predict(x_test)
print(“预测值为:”, y_predict)

5.2准确率

score=estimator.score(x_test,y_test)
print(“准确率为:”, score)

5.2最优模型参数:

print(“最优模型为:”, estimator.best_estimator_)

5.3最好评分

print(“最高分:”, estimator.best_score_)

数据集Facebook_Location下载地址:

链接:https://pan.baidu.com/s/1uoeo6pukkjSuLlKW9RwnCQ
提取码:7hlo

http://www.hkea.cn/news/418497/

相关文章:

  • 大连做网站不错的公司怎样把广告放到百度
  • 网站上面带官网字样怎么做的网站设计的流程
  • 有个网站是做视频相册的网球排名即时最新排名
  • 论坛网站备案流程图优化大师怎么提交作业
  • 织梦政府网站模板百度在线入口
  • 专业做婚纱摄影网站会员制营销
  • 网站内容丰富互动营销平台
  • 阿里巴巴logo高清图谷歌seo网站推广
  • 网站如何做内链seo高手是怎样炼成的
  • 设计师个人网站建设怎样注册一个自己的平台
  • 徐州营销网站建设产品线上推广渠道
  • 绍兴市网站建设公司企业官网搭建
  • 关于网页设计的网站免费发布信息网站大全
  • 郑州新闻头条seo基础教程
  • 做网站比较大的公司朔州seo
  • 如何制作私人网站福州专业的seo软件
  • 做网站主流技术南宁在哪里推广网站
  • 老板让我做网站负责人微博营销软件
  • 教我做网站百度打开
  • 网站开发时如何兼容电商运营是做什么的
  • 河北建设银行石家庄分行招聘网站怎么申请自己的网络平台
  • vs2008 做网站搜索引擎的工作原理是什么
  • 东莞常平做网站公司app营销策划方案
  • 爱用建站 小程序重庆网站制作公司
  • 网站建设小企业案例漯河网络推广哪家好
  • wordpress 清空回收站合肥网站优化软件
  • 电站建设招聘网站智推教育seo课程
  • 做静态网站选用什么服务器站长素材网站
  • 网站建设先做前台还是后台百度认证是什么
  • 广州专业做crm系统的供应商seo网站培训班