当前位置: 首页 > news >正文

网站建设敬请期待图片素材小蓝鸟加速器

网站建设敬请期待图片素材,小蓝鸟加速器,大悟县建设局网站,ppt模板做的好的网站有哪些数据提取之JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式#xff0c;它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景#xff0c;比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不…数据提取之JSON与JsonPATH JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景比如网站前台与后台之间的数据交互。 JSON和XML的比较可谓不相上下。 Python 2.7中自带了JSON模块直接import json就可以使用了。 官方文档http://docs.python.org/library/json.html Json在线解析网站http://www.json.cn/# JSON json简单说就是javascript中的对象和数组所以这两种结构就是对象和数组两种结构通过这两种结构可以表示各种复杂的结构 对象对象在js中表示为{ }括起来的内容数据结构为 { keyvalue, keyvalue, ... }的键值对的结构在面向对象的语言中key为对象的属性value为对应的属性值所以很容易理解取值方法为 对象.key 获取属性值这个属性值的类型可以是数字、字符串、数组、对象这几种。数组数组在js中是中括号[ ]括起来的内容数据结构为 [Python, javascript, C, ...]取值方式和所有语言中一样使用索引获取字段值的类型可以是 数字、字符串、数组、对象几种。 import json json模块提供了四个功能dumps、dump、loads、load用于字符串 和 python数据类型间进行转换。 1. json.loads() 作用把json格式的字符串转为Python数据类型 # json_loads.pyimport jsonstrList [1, 2, 3, 4]strDict {city: 北京, name: 大猫}json.loads(strList) # [1, 2, 3, 4]json.loads(strDict) # json数据自动按Unicode存储 # {ucity: u\u5317\u4eac, uname: u\u5927\u732b}2. json.dumps() 把 python 类型 转为 json 类型 import json# json.dumps()之前 item {name:QQ,app_id:1} print(before dumps,type(item)) # dict # json.dumps之后 item json.dumps(item) print(after dumps,type(item)) # str3. json.dump() 把python数据类型转为 json格式的字符串 注意一般让你把抓取的数据保存为json文件时使用 # 示例1 import jsonitem {name:QQ,app_id:1} with open(小米.json,a) as f:json.dump(item,f,ensure_asciiFalse)# 示例2 import jsonitem_list [] for i in range(3):item {name:QQ,id:i}item_list.append(item)with open(xiaomi.json,a) as f:json.dump(item_list,f,ensure_asciiFalse)4. json.load() 将json文件读取,并转为python类型 import jsonwith open(D:\\spider_test\\xiaomi.json,r) as f:data json.load(f)print(data)json模块总结 # 爬虫最常用 1、数据抓取 - json.loads(html)将响应内容由: json 转为 python 2、数据保存 - json.dump(item_list,f,ensure_asciiFalse)将抓取的数据保存到本地 json文件# 抓取数据一般处理方式 1、txt文件 2、csv文件 3、json文件 4、MySQL数据库 5、MongoDB数据库 6、Redis数据库JsonPath了解 JsonPath 是一种信息抽取类库是从JSON文档中抽取指定信息的工具提供多种语言实现版本包括Javascript, Python PHP 和 Java。 JsonPath 对于 JSON 来说相当于 XPATH 对于 XML。 下载地址https://pypi.python.org/pypi/jsonpath 安装方法点击Download URL链接下载jsonpath解压之后执行python setup.py install 官方文档http://goessner.net/articles/JsonPath JsonPath与XPath语法对比 Json结构清晰可读性高复杂度低非常容易匹配下表中对应了XPath的用法。 XPathJSONPath描述/$根节点.现行节点/.or[]取子节点..n/a取父节点Jsonpath未支持//..就是不管位置选择所有符合条件的条件**匹配所有元素节点n/a根据属性访问Json不支持因为Json是个Key-value递归结构不需要。[][]迭代器标示可以在里边做简单的迭代操作如数组下标根据内容选值等|[,]支持迭代器中做多选。[]?()支持过滤操作.n/a()支持表达式计算()n/a分组JsonPath不支持 示例 我们以拉勾网城市JSON文件 http://www.lagou.com/lbs/getAllCitySearchLabels.json 为例获取所有城市。 # jsonpath_lagou.pyimport requests import jsonpath import json import chardeturl http://www.lagou.com/lbs/getAllCitySearchLabels.json response equests.get(url) html response.text# 把json格式字符串转换成python对象 jsonobj json.loads(html)# 从根节点开始匹配name节点 citylist jsonpath.jsonpath(jsonobj,$..name)print (citylist) print (type(citylist)) fp open(city.json,w)content json.dumps(citylist, ensure_asciiFalse) print (content)fp.write(content.encode(utf-8)) fp.close()
http://www.hkea.cn/news/14443119/

相关文章:

  • 东营网站设计制作移动端网站建设的好处
  • 做书的网站有哪些内容阿里云邮箱企业邮箱
  • 寿光shengkun网站建设温州专业微网站制作报价
  • asp.net 网站开发的技术优势wordpress淡出
  • 湖南做网站 在线磐石网络万户网络有限责任公司
  • 营销型的网站域名网站功能结构图 怎么做
  • 网页游戏网站搭建威县网站建设
  • 无忧网站源码新能源车排名前十名
  • 网站制作相关知识做网站开发怎么接单
  • 外贸网站源码移动开发的几种方式
  • 分类网站一天做几条合适部门网站建设和维护
  • 网站设计公司怎么样接兼职建设网站
  • 网站被js植入广告html小清新类型网站
  • php建立网站ap课程培训哪家机构好
  • 汕头模板建站流程wordpress 购物主题
  • 在百度怎样建网站旅游网站效果图
  • 营销传播seo关键词排名软件
  • 上海网站关键排名网站建设 上海网
  • 博客网站建设设计报告wordpress评论提醒插件
  • 知名企业创新案例夫唯seo怎么样
  • 上海 顶尖 网站设计衡阳企业网站
  • 景安怎么把网站做别名网站开发工单
  • 个人如何注册电商平台网站优化seo怎么做
  • 透明管理系统网站模板门户网站的推广方案
  • 网站建设企业模板美食网页制作代码
  • 百度竞价网站备案谷歌google官网下载
  • 国外手做网站怎么推广自己
  • 网站被降权重新做网站昭阳区住房和城乡建设管理局网站
  • 广州建设手机网站网站建设模板怎么直接套
  • 公司网站建设为什么不直接买模版wordpress能生成静态文件下载