当前位置: 首页 > news >正文

想开个小说网站怎么做培训网站设计

想开个小说网站怎么做,培训网站设计,做网站的规范尺寸,易语言做网站视频最近在搜集数据要做分析#xff0c;一般的数据来源是一手数据#xff08;生产的#xff09;和二手数据#xff08;来自其他地方的#xff09;。 今天我们爬取同花顺这个网站的数据。url为#xff1a;https://data.10jqka.com.cn/ipo/xgsgyzq/ 话不多说直接上代码。有帮…最近在搜集数据要做分析一般的数据来源是一手数据生产的和二手数据来自其他地方的。 今天我们爬取同花顺这个网站的数据。url为https://data.10jqka.com.cn/ipo/xgsgyzq/ 话不多说直接上代码。有帮助到各位的给**点赞评论收藏**。一 导入包 import time import csv import requests from bs4 import BeautifulSoup import re import pandas as pd二 urlrequests请求 url https://data.10jqka.com.cn/ipo/xgsgyzq/ headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3} response requests.get(url, headersheaders) response.encoding GBK # utf-8 main_string response.text 三 获取字段名称 soup BeautifulSoup(main_string, html) # html.parser # 正则表达式匹配a标签内的文本 pattern ra[^]*(.*?)/a matches re.findall(pattern, str(soup.find_all(th)[0:18]), re.DOTALL) name_list [] for match in matches:name_list.append(match) cleaned_list [item.strip() if i 0 else item for i, item in enumerate(name_list)] # 有空字符 去掉 print(cleaned_list) ## 字段名称字段名称 [‘股票代码’, ‘股票简称’, ‘申购代码’, ‘发行总数万股’, ‘网上发行万股’, ‘申购上限万股’,‘顶格申请需配市值万元’, ‘发行价格’, ‘发行市盈率’, ‘行业市盈率’, ‘申购日期’, ‘中签率%’, ‘中签号’, ‘中签缴款日期’, ‘上市日期’, ‘打新收益元’, ‘首日最高涨幅’, ‘连板天数’] 四 提取数据 soup2 BeautifulSoup(main_string, html) # 提取所有td标签内的内容以及span标签的target属性 all_td_contents [td.get_text(stripTrue, separator ) for td in soup2.find_all(td)] all_target_values [span.get(target) for span in soup2.find_all(span, class_jumpToclient1)] data_list [] ## 将数据添加到data_list里面 存在有问题的数据 for content in all_td_contents:data_list.append(content) print(data_list) ## 将有问题的数据处理保留干净的数据 new_data [] # 遍历原始数据列表 for item in data_list:# 检查元素是否包含中签结果的关键词if 网上定价发行摇号中签结果 in item:parts item.split( )date_part parts[0]new_data.append(date_part)else:# 如果不是中签结果则直接添加到新列表中new_data.append(item) print(new_data)部分结果 [‘603381’, ‘永臻股份’, ‘732381’, ‘5931.41’, ‘2135.3’, ‘2.10’, ‘21.00’, ‘-’, ‘-’, ‘17.20’, ‘06-17 周一’, ‘-’, ‘06-19’, ‘06-19’, ‘-’, ‘-’, ‘-’, ‘-’, ‘301580’, ‘爱迪特’, ‘301580’, ‘1902.9382’, ‘542.3’, ‘0.50’, ‘5.00’, ‘-’, ‘-’, ‘27.62’, ‘06-17 周一’, ‘-’, ‘06-19’, ‘06-19’, ‘-’, ‘-’, ‘-’, ‘-’] 五 建csv表以及将数据录入 original_list new_data ## 创建csv表 fieldnames [股票代码, 股票简称, 申购代码, 发行总数万股, 网上发行万股, 申购上限万股,顶格申请需配市值万元, 发行价格, 发行市盈率, 行业市盈率, 申购日期, 中签率%, 中签号, 中签缴款日期, 上市日期, 打新收益元, 首日最高涨幅, 连板天数] filename rE:\工作\数据收集\数据\股票数据爬取\股票数据爬取.csv with open(filename, w, newline) as csvfile:writer csv.DictWriter(csvfile, fieldnamesfieldnames)writer.writeheader() # 写入表头字段名 print(fCSV文件 {filename} 已创建并写入数据。) ## 写入数据 with open(filename, a, newline) as csvfile:writer csv.writer(csvfile)# 使用列表推导式或循环来生成包含最多18个元素的子列表for i in range(0, len(original_list), 18):row original_list[i:i 18] # 取列表中的18个元素writer.writerow(row) 部分结果
http://www.hkea.cn/news/14527495/

相关文章:

  • 大连建设工程设计院有限公司网站简约网站设计
  • 网站建设与管理实验目的定州做网站
  • 网站建设 牛商网网站建设首先要学会什么
  • 怎样让自己做的网站被百度收录企业网站建设调研报告
  • qq网页即时聊天宁波seo网络推广软件系统
  • 做网站需要几个人分工创建个人网站怎么赚钱
  • 别人是怎么建设网站的旅游景点网站设计
  • 山东美建站网站开发国内外现状
  • 从事网站类网站建设的广东省建设执业注册中心网站
  • 男女做那个全面视频网站wordpress防止攻击
  • 白云区做网站公司如何制作一个公司网页
  • 有那些做任务的网站宁波网站设计皆选蓉胜网络
  • 网站百度权重网站视觉风格
  • 深圳网站设计首选刻石家庄网站建设 河北供求网
  • 网站后台模板数据中心网络架构
  • 电子商务网站建设工资兰州网站备案
  • 在网上做黑彩网站会怎样处罚手机网站建设公司
  • 北京p2p网站建设湛江网站的建设
  • 网站运行费用恢复原来的百度
  • 怎么用小皮创建网站故城网站建设
  • 人才招聘网站建设推广引流平台排行榜
  • 深圳 网站策划android studio手机版
  • 东莞网站建设是什么意思大淘客构建自己的网站
  • 电子商务网站建设新手房屋建筑图纸设计
  • 跑腿网站建设网络科技公司起名大全参考
  • 兰州网站外包西安广告设计与制作公司
  • ftp网站建立竞猜网站开发多少钱
  • 网站制作培训课程怎么做汽车网站
  • 昆明seocn整站优化杭州哪家网站建设公司好
  • 襄阳网站建设哪个好成都展览展示有限公司