当前位置: 首页 > news >正文

网站策划 ppt长沙seo服务

网站策划 ppt,长沙seo服务,网站被k 换个域名可以,如何做返利网站在 Spark 中#xff0c;explain 函数用于提供数据框#xff08;DataFrame#xff09;或 SQL 查询的逻辑计划和物理执行计划的详细解释。它可以帮助开发者理解 Spark 是如何执行查询的#xff0c;包括优化过程、转换步骤以及它将采用的物理执行策略。 1. 逻辑计划 (Logical…在 Spark 中explain 函数用于提供数据框DataFrame或 SQL 查询的逻辑计划和物理执行计划的详细解释。它可以帮助开发者理解 Spark 是如何执行查询的包括优化过程、转换步骤以及它将采用的物理执行策略。 1. 逻辑计划 (Logical Plan) 逻辑计划代表了 Spark 将应用于处理数据的抽象操作序列。它是基于用户提供的 DataFrame API 或 SQL 查询经过优化前的中间表示。 未优化的逻辑计划这是查询的初始形式尚未应用任何优化。优化后的逻辑计划这是经过 Spark 应用了一些规则如谓词下推、常量折叠、简化等后的查询计划。 2. 物理计划 (Physical Plan) 物理计划表示 Spark 如何实际执行查询。它包括如何对数据进行 Shuffle洗牌、分区或合并的详细信息。物理计划通常有多个选择Spark 会根据成本如计算开销、数据传输等选择最优的执行计划。 RDD弹性分布式数据集操作物理计划会显示 Spark 执行数据处理时所使用的具体转换步骤和操作。 3. 基于成本的优化 (Cost-Based Optimization) 在某些情况下Spark 还可以执行基于成本的优化如选择不同的连接策略或决定是否执行广播连接具体取决于可用的统计信息。 4. 使用示例 4.1 PySpark 示例 df spark.read.csv(data.csv, headerTrue, inferSchemaTrue)# 执行一些转换操作 df_filtered df.filter(df[age] 25).select(name, age)# 输出查询执行计划 df_filtered.explain(True)4.2 Spark SQL 示例 # 使用 SQL 执行查询 spark.sql(SELECT name, age FROM people WHERE age 25).explain(True)输出 explain(True) 的结果 当调用 explain(True) 时您会看到一个包含 逻辑计划 和 物理计划 的详细输出。以下是一个简单的输出示例 Physical Plan *Project [name#0, age#1] - *Filter (age#1 25)- *Scan ExistingRDD[name#0, age#1] Batched: false, Format: CSV, Location: InMemoryFileIndex[file:/data.csv], PartitionFilters: [], PushedFilters: [GreaterThan(age,25)], ReadSchema: structname:string,age:int Logical Plan Project [name#0, age#1] - Filter (age#1 25)- Relation[name#0, age#1] csv输出内容的关键元素 物理计划 Project表示选取了哪些列。Filter表示应用的过滤条件。Scan ExistingRDD表示数据的读取来源在这个例子中是 CSV 文件。 逻辑计划 逻辑计划中显示了用户代码中定义的 Project 和 Filter 操作。 使用 explain 的场景 优化调试可以使用 explain 来检查 Spark 是否正确优化了查询。连接优化如果您不确定 Spark 如何处理连接explain 可以帮助您查看 Spark 是否使用了合适的连接策略例如广播连接或 Shuffle 连接。性能调优通过检查物理计划您可以识别出 Spark 可能执行的无谓操作或者有机会进一步优化的地方。 5. 详细语法 EXPLAIN [ EXTENDED | CODEGEN | COST | FORMATTED ] statement EXTENDED 生成解析后的逻辑计划、分析后的逻辑计划、优化后的逻辑计划和物理计划。 解析后的逻辑计划是从查询中提取的未解析计划。 分析后的逻辑计划通过将未解析的属性unresolvedAttribute和未解析的关系unresolvedRelation转换为完全类型化的对象来完成转换。 优化后的逻辑计划通过一组优化规则进行转换最终生成物理计划。 CODEGEN 生成语句的代码如果有和物理计划。 COST 如果计划节点的统计信息可用生成逻辑计划和统计信息。 FORMATTED 生成两个部分物理计划概述和节点详细信息。 statement 指定要解释的SQL语句。 -- Default Output EXPLAIN select k, sum(v) from values (1, 2), (1, 3) t(k, v) group by k; ---------------------------------------------------- | plan| ---------------------------------------------------- | Physical Plan *(2) HashAggregate(keys[k#33], functions[sum(cast(v#34 as bigint))])- Exchange hashpartitioning(k#33, 200), true, [id#59]- *(1) HashAggregate(keys[k#33], functions[partial_sum(cast(v#34 as bigint))])- *(1) LocalTableScan [k#33, v#34] | ------------------------------------------------------ Using Extended EXPLAIN EXTENDED select k, sum(v) from values (1, 2), (1, 3) t(k, v) group by k; ---------------------------------------------------- | plan| ---------------------------------------------------- | Parsed Logical Plan Aggregate [k], [k, unresolvedalias(sum(v), None)]- SubqueryAlias t- UnresolvedInlineTable [k, v], [List(1, 2), List(1, 3)] Analyzed Logical Plan k: int, sum(v): bigintAggregate [k#47], [k#47, sum(cast(v#48 as bigint)) AS sum(v)#50L]- SubqueryAlias t- LocalRelation [k#47, v#48] Optimized Logical Plan Aggregate [k#47], [k#47, sum(cast(v#48 as bigint)) AS sum(v)#50L]- LocalRelation [k#47, v#48] Physical Plan *(2) HashAggregate(keys[k#47], functions[sum(cast(v#48 as bigint))], output[k#47, sum(v)#50L]) - Exchange hashpartitioning(k#47, 200), true, [id#79]- *(1) HashAggregate(keys[k#47], functions[partial_sum(cast(v#48 as bigint))], output[k#47, sum#52L])- *(1) LocalTableScan [k#47, v#48] | ------------------------------------------------------ Using Formatted EXPLAIN FORMATTED select k, sum(v) from values (1, 2), (1, 3) t(k, v) group by k; ---------------------------------------------------- | plan| ---------------------------------------------------- | Physical Plan * HashAggregate (4)- Exchange (3)- * HashAggregate (2)- * LocalTableScan (1)(1) LocalTableScan [codegen id : 1]Output: [k#19, v#20](2) HashAggregate [codegen id : 1]Input: [k#19, v#20](3) ExchangeInput: [k#19, sum#24L](4) HashAggregate [codegen id : 2]Input: [k#19, sum#24L]
http://www.hkea.cn/news/14453480/

相关文章:

  • 东莞专业网站推广方式vi设计公司排行
  • 网站备案收费幕布网站优化要怎么做
  • 景观做文本常用的网站网页制作公司设计理念
  • 没有做老千的斗牛网站6邯郸百度爱采购
  • 包头住房和城乡建设厅网站如何开设网站
  • 文化馆网站建设解决方案百度收录最好的网站
  • 做网站的公司重庆wordpress极简名片主题
  • 萧山城市建设网站王展简历
  • 企业外贸网站python 做 网站
  • 深圳网站制作排行榜怎样新建一个网页
  • 网站更换主机注意网站功能有哪些
  • 网站建设公司品牌过年做那个网站致富
  • 网站后台密码是什么合肥品牌设计
  • 快注销网站淘宝联盟的网站怎么自己做
  • 公司网站建设和推广有哪些搜索引擎网站
  • 文明网i中国精神文明建设门户网站电子商务网站主要功能
  • 私人网站如何做竞价网站后台统计
  • 郑州做网站开发销售青岛的互联网企业
  • 官网网站模板网站建设接口开发
  • wordpress的网站怎么让他上线湖北短视频搜索seo
  • 如何找人帮我做网站推广网络设计与实施
  • 网站如何做分布式深圳建站公司设计深业集团
  • 网站建设对电子商务的意义怎么免费建设金融网站
  • 网站建设规章制度dw怎么做购物网站
  • 石家庄做网站最好的公司有哪些网页界面设计中主要包括哪三个方面
  • 怎么看自己的网站是用什么做的做推广优化的网站有哪些内容
  • 网站程序文件django做的网站
  • 广州网站推广服务安阳网站建设开发
  • 锚文本对网站十堰优化seo
  • 宁夏中卫市林业生态建设局网站wordpress iis rewrite