当前位置: 首页 > news >正文

移动网站建设机构广州科 外贸网站建设

移动网站建设机构,广州科 外贸网站建设,全国 做网站的企业,网站建设是不是要有营业执照本文以Python爬虫、数据分析、后端、数据挖掘、全栈开发、运维开发、高级开发工程师、大数据、机器学习、架构师这10个岗位#xff0c;从拉勾网上爬取了相应的职位信息和任职要求#xff0c;并通过数据分析可视化#xff0c;直观地展示了这10个职位的平均薪资和学历、工作经… 本文以Python爬虫、数据分析、后端、数据挖掘、全栈开发、运维开发、高级开发工程师、大数据、机器学习、架构师这10个岗位从拉勾网上爬取了相应的职位信息和任职要求并通过数据分析可视化直观地展示了这10个职位的平均薪资和学历、工作经验要求。 文章很长耐心观看。 01 爬虫准备 1、先获取薪资和学历、工作经验要求 由于某网数据加载是动态加载的需要我们分析。分析方法如下 F12分析页面数据存储位置我们发现网页内容是通过post请求得到的返回数据是json格式那我们直接拿到json数据即可。 我们只需要薪资和学历、工作经验还有单个招聘信息返回json数据字典中对应的英文为positionId,salary, education, workYearpositionId为单个招聘信息详情页面编号。相关操作代码如下 文件存储 def file_do(list_info):# 获取文件大小file_size os.path.getsize(rG:\lagou_anv.csv)if file_size 0:# 表头name [ID,薪资, 学历要求, 工作经验]# 建立DataFrame对象file_test pd.DataFrame(columnsname, datalist_info)# 数据写入file_test.to_csv(rG:\lagou_anv.csv, encodinggbk, indexFalse)else:with open(rG:\lagou_anv.csv, a, newline) as file_test:# 追加到文件后面writer csv.writer(file_test)# 写入文件writer.writerows(list_info)基本数据获取 # 1. post 请求 url req_url https://www.lagou.com/jobs/positionAjax.json?needAddtionalResultfalse # 2.请求头 headers headers {Accept: application/json,text/javascript,*/*;q0.01,Connection: keep-alive,Cookie: 你的Cookie值必须加上去,Host: www.lagou.com,Referer: https://www.lagou.com/jobs/list_Python?labelWordsfromSearchtruesuginput,User-Agent: str(UserAgent().random), }def get_info(headers):# 3.for 循环请求一共30页for i in range(1, 31):# 翻页data {first: true,kd: Python爬虫,pn: i}# 3.1 requests 发送请求req_result requests.post(req_url, datadata, headersheaders)req_result.encoding utf-8print(第%d页%istr(req_result.status_code))# 3.2 获取数据req_info req_result.json()# 定位到我们所需数据位置req_info req_info[content][positionResult][result]print(len(req_info))list_info []# 3.3 取出具体数据for j in range(0, len(req_info)):salary req_info[j][salary]education req_info[j][education]workYear req_info[j][workYear]positionId req_info[j][positionId]list_one [positionId,salary, education, workYear]list_info.append(list_one)print(list_info)# 存储文件file_do(list_info)time.sleep(1.5)运行结果 2、根据获取到的positionId 来访问招聘信息详细页面 根据positionId还原访问链接 position_url [] def read_csv():# 读取文件内容with open(rG:\lagou_anv.csv, r, newline) as file_test:# 读文件reader csv.reader(file_test)i 0for row in reader:if i ! 0 :# 根据positionID补全链接url_single https://www.lagou.com/jobs/%s.html%row[0]position_url.append(url_single)i i 1print(一共有str(i-1)个)print(position_url)访问招聘信息详情页面获取职位描述岗位职责和岗位要求并清理数据 def get_info():for position_url in position_urls:work_duty work_requirement response00 get_response(position_url,headers headers)time.sleep(1)content response00.xpath(//*[idjob_detail]/dd[2]/div/p/text())# 数据清理j 0for i in range(len(content)):content[i] content[i].replace(\xa0, )if content[i][0].isdigit():if j 0:content[i] content[i][2:].replace(、, )content[i] re.sub([;.0-9。],, content[i])work_duty work_dutycontent[i] /j j 1elif content[i][0] 1 and not content[i][1].isdigit():breakelse:content[i] content[i][2:].replace(、, )content[i] re.sub([、;.0-9。],,content[i])work_duty work_duty content[i] /m i# 岗位职责write_file(work_duty)print(work_duty)# 数据清理j 0for i in range(m,len(content)):content[i] content[i].replace(\xa0, )if content[i][0].isdigit():if j 0:content[i] content[i][2:].replace(、, )content[i] re.sub([、;.0-9。], , content[i])work_requirement work_requirement content[i] /j j 1elif content[i][0] 1 and not content[i][1].isdigit():# 控制范围breakelse:content[i] content[i][2:].replace(、, )content[i] re.sub([、;.0-9。], , content[i])work_requirement work_requirement content[i] /# 岗位要求write_file2(work_requirement)print(work_requirement)print(-----------------------------)运行结果 dutyrequire 3、四种图可视化数据数据清理方式 矩形树图 # 1.矩形树图可视化学历要求 from pyecharts import TreeMap education_table {} for x in education:education_table[x] education.count(x) key [] values [] for k,v in education_table.items():key.append(k)values.append(v)data [] for i in range(len(key)) :dict_01 {value: 40, name: 我是A}dict_01[value] values[i]dict_01[name] key[i]data.append(dict_01) tree_map TreeMap(矩形树图, width1200, height600) tree_map.add(学历要求,data, is_label_showTrue, label_posinside)玫瑰饼图 # 2.玫瑰饼图可视化薪资 import re import math# 薪水分类 parameter : str_01--字符串原格式:20k-30k returned value : (a0b0)/2 --- 解析后变成数字求中间值25.0def assort_salary(str_01):reg_str01 (\d)res_01 re.findall(reg_str01, str_01)if len(res_01) 2:a0 int(res_01[0])b0 int(res_01[1])else :a0 int(res_01[0])b0 int(res_01[0])return (a0b0)/2from pyecharts import Pie salary_table {} for x in salary:salary_table[x] salary.count(x)key [5k以下,5k-10k,10k-20k,20k-30k,30k-40k,40k以上] a0,b0,c0,d0,e0,f0[0,0,0,0,0,0]for k,v in salary_table.items():ave_salary math.ceil(assort_salary(k))print(ave_salary)if ave_salary 5:a0 a0 velif ave_salary in range(5,10):b0 b0 velif ave_salary in range(10,20):c0 c0 velif ave_salary in range(20,30):d0 d0 velif ave_salary in range(30,40):e0 e0 velse :f0 f0 v values [a0,b0,c0,d0,e0,f0]pie Pie(薪资玫瑰图, title_poscenter, width900) pie.add(salary,key,values,center[40, 50],is_randomTrue,radius[30, 75],rosetypearea,is_legend_showFalse,is_label_showTrue)普通柱状图 # 3.工作经验要求柱状图可视化 from pyecharts import Bar workYear_table {} for x in workYear:workYear_table[x] workYear.count(x) key [] values [] for k,v in workYear_table.items():key.append(k)values.append(v) bar Bar(柱状图) bar.add(workYear, key, values, is_stackTrue,center (40,60))词云图 import jieba from pyecharts import WordCloud import pandas as pd import re,numpystopwords_path H:\PyCoding\Lagou_analysis\stopwords.txt def read_txt():with open(G:\lagou\Content\\ywkf_requirement.txt,encodinggbk) as file:text file.read()content text# 去除所有评论里多余的字符content re.sub([,。. \r\n], , content)segment jieba.lcut(content)words_df pd.DataFrame({segment: segment})# quoting3 表示stopwords.txt里的内容全部不引用stopwords pd.read_csv(stopwords_path, index_colFalse,quoting3, sep\t, names[stopword], encodingutf-8)words_df words_df[~words_df.segment.isin(stopwords.stopword)]words_stat words_df.groupby(by[segment])[segment].agg({计数: numpy.size})words_stat words_stat.reset_index().sort_values(by[计数], ascendingFalse)test words_stat.head(200).valuescodes [test[i][0] for i in range(0, len(test))]counts [test[i][1] for i in range(0, len(test))]wordcloud WordCloud(width1300, height620)wordcloud.add(必须技能, codes, counts, word_size_range[20, 100])wordcloud.render(H:\PyCoding\Lagou_analysis\cloud_pit\ywkf_bxjn.html)02 Python爬虫岗位 学历要求 工作月薪 工作经验要求 爬虫技能 关键词解析 学历本科工作月薪10k-30k工作经验1-5年技能分布式、多线程、框架、Scrapy、算法、数据结构、数据库 综合爬虫这个岗位在学历要求上比较放松大多数为本科即可比较适合想转业的老哥小姐姐学起来也不会特别难。而且薪资待遇上也还算比较优厚基本在10k以上。不过唯一对工作经验要求还是比较高的有近一半的企业要求工作经验要达到3年以上。 03 Python数据分析岗位 学历要求 工作月薪 工作经验要求 数据分析技能 关键词解析 学历本科硕士比例有所增高工作月薪10k-30k工作经验1-5年技能SAS、SPSS、Hadoop、Hive、数据库、Excel、统计学、算法 综合数据分析这个岗位在学历要求上比爬虫要求稍微高一些硕士比例有所提升专业知识上有一定要求。薪资待遇上也还算比较优厚基本在10k以上同时薪资在30k-40k的比例也有所上升。对工作经验要求还是比较高大部分的企业要求工作经验要达到3年以上。 04 Python后端岗位 学历要求 工作月薪 工作经验要求 后端技能 关键词解析 学历本科工作月薪10k-30k工作经验3-5年技能Flask、Django、Tornado、Linux、MySql、Redis、MongoDB、TCP/IP、数学哈哈 综合web后端这个岗位对学历要求不高但专业知识上有很大要求得会Linux操作系统基本操作、三大主流数据库的使用、以及三大基本web框架的使用等计算机相关知识总体来说难道还是比较大。薪资待遇上也比较优厚基本在10k以上同时薪资在30k-40k的比例也有近20%。对工作经验要求还是比较高大部分的企业要求工作经验要达到3年以上。 05 Python数据挖掘岗位 学历要求 工作月薪 工作经验要求 数据挖掘技能 关键词解析 学历本科(硕士)工作月薪20k-40k工作经验3-5年技能学历(hhh)、Hadoop、Spark、MapReduce、Scala、Hive、聚类、决策树、GBDT、算法 综合数据挖掘这个岗位在学历要求是最高的虽然还是本科居多但硕士比例明显增加还有公司要求博士学历。在专业知识上也有很大要求得会Linux操作系统基本操作、大数据框架Hadoop、Spark以及数据仓库Hive的使用等计算机相关知识总体来说难道还是比较大。薪资待遇上特别优厚基本在20k以上薪资在30k-40k的比例也有近40%对工作经验要求还是比较高大部分的企业要求工作经验要达到3年以上。 06 Python全栈开发岗位 学历要求 工作月薪 工作经验要求 全栈开发技能 关键词解析 学历本科工作月薪10k-30k工作经验3-5年技能测试、运维、管理、开发、数据结构、算法、接口、虚拟化、前端 综合全栈开发这个岗位什么都要懂些什么都要学些在学历要求上并不太高本科学历即可在专业知识上就不用说了各个方面都得懂还得理解运用。薪资待遇上也还可以基本在10k以上薪资在30k-40k的比例也有近20%。对工作经验要求还是比较高大部分的企业要求工作经验要达到3年以上。总体来说就我个人而言会觉得全栈是个吃力多薪水少的岗位。 07 Python运维开发岗位 学历要求 工作月薪 工作经验要求 运维开发技能 关键词解析 学历本科工作月薪10k-30k工作经验3-5年技能SVN、Git、Linux、框架、shell编程、mysqlredisansible、前端框架 综合运维开发这个岗位在学历要求上不高除开占一大半的本科就是专科了。工作经验上还是有一些要求大多数要求有3-5年工作经验。从工资上看的话不高也不低20k以上也占有62%左右。要学习的东西也比较多前端、后端、数据库、操作系统等等。 08 Python高级开发工程师岗位 学历要求 工作月薪 工作经验要求 高级开发工程师技能 关键词解析 学历本科工作月薪20k左右工作经验3-5年技能WEB后端、MySQL、MongoDB、Redis、Linux系统CentOS、CI/CD 工具、GitHub 综合高级开发工程师这个岗位在学历要求上与运维开发差不多薪资也相差不大22%以上的企业开出了30k以上的薪资65%左右企业给出20k以上的薪资。当然对工作经验上还是要求较高有近一半的企业要求工作经验要达到3年以上。 09 Python大数据岗位 学历要求 工作月薪 工作经验要求 大数据技能 关键词解析 学历本科硕士也占比很大工作月薪30k以上工作经验3-5年技能前端开发、 MySQL、Mongo、Redis、Git 、Flask、Celery、Hadoop/HBase/Spark/Hive、Nginx 综合现在是大数据时代大数据这个岗位也是相当火热在学历要求上几乎与运维开发一模一样。当然可能数据上出现了巧合本科居多工作经验上1-5年占据一大半薪资上也基本上在20k以上该岗位薪资在20k以上的企业占了55%左右。 10 Python机器学习岗位 学历要求 工作月薪 工作经验要求 机器学习技能 关键词解析 学历本科硕士也占比很大工作月薪30k以上工作经验3-5年技能Machine LearningData MiningAlgorithm 研发算法Linux决策树TFSparkMLlibCafe 综合机器学习这个岗位在学历要求上比较严格虽然看起来是本科居多但对于刚毕业或毕业不久的同学如果只是个本科应聘还是很有难度的。当然机器学习岗位薪资特高60%在30k以上近90%在20k以上97%在10k以上。除开对学历要求比较高外对工作经验要求也比较高有近一半的企业要求工作经验要达到3年以上。 11 Python架构师岗位 学历要求 工作月薪 工作经验要求 架构师技能 关键词解析 学历本科工作月薪30k以上工作经验5-10年技能FlaskDjangoMySQLRedisMongoDBHadoopHiveSparkElasticSearchPandasSpark/MRKafka/rabitmq 综合架构师这个岗位单从学历上看不出什么来但在薪资上几乎与机器学习一样甚至比机器学习还要高机器学习中月薪40k以上的占23.56%架构师中月薪40k以上的占30.67%。在学历要求上比机器学习要略低本科居多但在工作经验上一半以上的企业要求工作经验在5-10年。在必要技能上也要求特别严格比之前说过的全栈开发师有过之而无不及。 看着这月薪我是超级想去了你呢 12 写在最后 从上文可以看出Python相关的各个岗位薪资还是不错的基本上所有岗位在10k以上的占90%20k以上的也基本都能占60%左右。而且学历上普遍来看本科学历占70%以上。唯一的是需要工作经验一般得有个3-5年工作经验也就是如果24岁本科毕业27岁就有很大机会拿到月薪20k以上。有没有很心动 关于Python技术储备 学好 Python 不论是就业还是做副业赚钱都不错但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料给那些想学习 Python 的小伙伴们一点帮助 Python学习路线汇总 Python所有方向的技术点做的整理形成各个领域的知识点汇总它的用处就在于你可以按照上面的知识点去找对应的学习资源保证自己学得较为全面。全套教程文末领取哈 Python必备开发工具 温馨提示篇幅有限已打包文件夹获取方式在文末 Python学习视频600合集 观看零基础学习视频看视频学习是最快捷也是最有效果的方式跟着视频中老师的思路从基础到深入还是很容易入门的。 实战案例 光学理论是没用的要学会跟着一起敲要动手实操才能将自己的所学运用到实际当中去这时候可以搞点实战案例来学习。 100道Python练习题 检查学习结果。 面试刷题 资料领取 上述这份完整版的Python全套学习资料已经上传CSDN官方朋友们如果需要可以微信扫描下方CSDN官方认证二维码输入“领取资料” 即可领取
http://www.hkea.cn/news/14429355/

相关文章:

  • 程序员代做网站违法桓台县网站建设
  • 什么静态网站容易做公司介绍
  • 专业做网站费用股票场外期权网站开发
  • 公司网站建设需要咨询什么问题设计网站有哪些
  • 怎么注销网站seo如何推广网站
  • 两个网站如何做端口映射北京市建设教育协会网站查询
  • 网站代码怎么看唐山市建设交易中心官方网站
  • 建设专业网站公司iis做的网站手机怎么访问
  • 网站开发 报价多网站绑定域名
  • 代做毕业设计网站家具设计郑州专业网站优化
  • 设计做的网站哪些好全英文外贸网站建设
  • 个人网站模板代码百度联盟的网站怎么做
  • 黄山网站建设jidela微信分销系统合法吗
  • 自己做壁纸的网站杭州网站建设外包公司
  • 长春网站建设公司排名长沙网
  • 多语言网站系统网站的营销
  • 邢路桥建设总公司网站爱站网为什么不能用了
  • 建设银行个人官方网站那些做环保网站的好处
  • wordpress安装怎么填镇江网站关键词优化
  • 兰州网站建设方法北京网络营销技术培训
  • 佛山网站建设定制模板下载网站源码
  • 如何把网站放在主机上计算机的专业有哪些
  • 自用电脑做网站青海网站建设公司电话
  • 网站建设基本概述德州做网站最好的公司有哪些
  • 课程网站开发开题报告wordpress 只显示文字
  • 网站内容该怎么做备案网站 cdn
  • 阿里云wordpress建站微信小程序开发快速入门
  • 专门做简历的网站企业网络推广搜索排名
  • 电脑公司网站系统源码站群系统破解版
  • 佛山网站优化宜昌网站模板