当前位置: 首页 > news >正文

网站建设与管理教程视频教程南京俄语网站建设

网站建设与管理教程视频教程,南京俄语网站建设,上海app开发制作,网站 手机网站SQL是用于数据分析和数据处理的最重要的编程语言之一#xff0c;因此与数据科学相关的工作#xff08;例如数据分析师、数据科学家和数据工程师#xff09;在面试时总会问到关于 SQL 的问题。 SQL面试问题旨在评估应聘者的技术和解决问题的能力。因此对于应聘者来说#x…SQL是用于数据分析和数据处理的最重要的编程语言之一因此与数据科学相关的工作例如数据分析师、数据科学家和数据工程师在面试时总会问到关于 SQL 的问题。 SQL面试问题旨在评估应聘者的技术和解决问题的能力。因此对于应聘者来说关键在于不仅要根据样本数据编写出正确的查询而且还要像对待现实数据集一样考虑各种场景和边缘情况。 在这篇文章中我将介绍 SQL 面试问题中常见的模式并提供一些在 SQL 查询中巧妙处理它们的技巧。 问问题 要搞定一场 SQL 面试最重要的是尽量多问问题获取关于给定任务和数据样本的所有细节。充分理解需求后接下来你就可以节省很多迭代问题的时间并且能很好地处理边缘情况。 我注意到许多候选人经常还没完全理解SQL问题或数据集就直接开始编写解决方案了。之后等我指出他们解决方案中存在的问题后他们只好反复修改查询。最后他们在迭代中浪费了很多面试时间甚至可能到最后都没有找到正确的解决方案。 我建议大家在参加SQL面试时就当成是自己在和业务伙伴共事。所以在你提供解决方案之前应该要针对数据请求了解清楚所有的需求。 举例 查找薪水最高的前 3 名员工。 样本employee_salary表 这里你应该要求面试官说清楚“前三名”具体是什么意思。我应该在结果中包括 3 名员工吗你要我怎样处理关系此外请仔细检查样本员工数据。salary 字段的数据类型是什么在计算之前是否需要清除数据 选哪一个JOIN 在SQL中JOIN 通常用来合并来自多个表的信息。 有四种不同类型的 JOIN但在大多数情况下我们只使用INNER、LEFT和FULLJOIN因为 RIGHTJOIN并不是很直观还可以使用 LEFTJOIN 很简单地重写。在 SQL 面试中需要根据给定问题的特定要求选择你要使用的正确JOIN。 举例 查找每个学生参加的课程总数。提供学生 id、姓名和选课的数量。 样本student和class_history表 你可能已经注意到了并非所有出现在 class_history 表中的学生都出现在了 student 表中这可能是因为这些学生已经毕业了。这在事务数据库中实际上是非常典型的情况因为不再活跃的记录往往会被删除。 根据面试官是否希望结果中包含毕业生我们需要使用LEFT JOIN或 INNER JOIN来组合两个表 WITH class_count AS (SELECT student_id, COUNT(*) AS num_of_classFROM class_historyGROUP BY student_id ) SELECT c.student_id,s.student_name,c.num_of_class FROM class_count c -- CASE 1: include only active students JOIN student s ON c.student_id s.student_id -- CASE 2: include all students -- LEFT JOIN student s ON c.student_id s.student_id技术提升 面试要学会分享、交流不建议闭门造车。一个人走的很快、一堆人可以走的更远。 本文由知识星球技术群粉丝分享项目源码、数据、技术交流提升均可加交流群获取群友已超过2000人添加时最好的备注方式为来源兴趣方向方便找到志同道合的朋友 方式①、添加微信号pythoner666备注来自CSDN 方式②、微信搜索公众号Python学习与数据挖掘后台回复加群 GROUP BY GROUP BY是SQL中最重要的功能因为它广泛用于数据聚合。如果在一个 SQL 问题中看到诸如求和、平均值、最小值或最大值之类的关键字这就表明你可能应该在查询中使用GROUP BY了。 一个常见的陷阱是在GROUP BY过滤数据时混淆 WHERE和HAVING——我见过很多人犯了这个错误。 举例 计算每个学生在每个学年的必修课程平均 GPA并找到每个学期中符合 Dean’s ListGPA≥3.5资格的学生。 样本gpa_history表 由于我们在GPA计算中仅考虑必修课程因此需要使用WHERE is_requiredTRUE来排除选修课程。 我们需要每位学生在每学年的平均GPA因此我们将同时GROUP BY student_id和school_year 列并取gpa列的平均值。最后我们只保留学生平均 GPA高于3.5的行可以使用HAVING来实现。合起来是下面这样 SELECT student_id,school_year,AVG(gpa) AS avg_gpa FROM gpa_history WHERE is_required TRUE GROUP BY student_id, school_year HAVING AVG(gpa) 3.5注意 每当在查询中使用GROUP BY时都只能选择group-by列和聚合列因为其他列中的行级信息已被舍弃。 SQL 查询执行顺序 大多数人会从SELECT开始从上到下编写SQL查询。 但你知道SQL引擎执行函数时要到后面才执行SELECT吗以下是 SQL 查询的执行顺序 FROM, JOIN WHERE GROUP BY HAVING SELECT DISTINCT ORDER BY LIMIT, OFFSET 再次考虑前面的示例 因为我们想在计算平均GPA之前过滤掉选修课程所以我使用WHERE is_requiredTRUE代替HAVING因为WHERE会在GROUP BY和HAVING之前执行。我不能编写HAVING avg_gpa 3.5的原因是avg_gpa被定义为SELECT的一部分因此无法在SELECT之前执行的步骤中引用它。 我建议在编写查询时遵循引擎的执行顺序这在编写复杂查询时会很有用。 Window 函数 Window函数也经常出现在SQL面试中。共有五种常见的Window函数 RANK/DENSE_RANK/ROW_NUMBER 它们通过排序特定列来为每行分配一个排名。如果给出了任何分区列则行将在其所属的分区组中排名。 LAG/LEAD 它根据指定的顺序和分区组从前一行或后一行检索列值。 在SQL面试中重要的是要了解排名函数之间的差异并知道何时使用LAG/LEAD。 举例 查找每个部门中薪水最高的前 3 名员工。 另一个示例employee_salary表 当一个SQL问题要求计算“TOP N”时我们可以使用ORDER BY或排名函数来回答问题。 但在这个示例中它要求计算“每个 Y 中的 TOP N X”这强烈暗示我们应该使用排名函数因为我们需要对每个分区组中的行进行排名。 以下查询恰好能找到 3 名薪水最高的员工而不论他们的关系如何如下 WITH T AS ( SELECT *,ROW_NUMBER() OVER (PARTITION BY department_id ORDER BY employee_salary DESC) AS rank_in_dep FROM employee_salary) SELECT * FROM T WHERE rank_in_dep 3 -- Note: When using ROW_NUMBER, each row will have a unique rank number and ranks for tied records are assigned randomly. For exmaple, Rimsha and Tiah may be rank 2 or 3 in different query runs.此外根据关系的处理方式我们可以选择其他排名函数。同样细节是很重要的 ROW_NUMBER,RANK,DENSE_RANK结果比较 重复项 SQL面试中的另一个常见陷阱是忽略数据重复。 尽管样本数据中的某些列似乎具有不同的值但面试官还是希望候选人考虑所有可能性就像他们在处理真实数据集一样。 例如 在上一个示例employee_salary表中可以让雇员共享相同的名称。 要避免由重复项导致的潜在问题一种简单方法是始终使用 ID 列唯一地标识不同的记录。 举例 使用 employee_salary 表查找每个部门所有员工的总薪水。 正确的解决方案是 GROUP BY employee_id然后使用 SUM(employee_salary) 计算总薪水。如果需要雇员姓名请在末尾与 employee 表联接以检索雇员姓名信息。 错误的方法是使用 GROUP BY employee_name。 NULL 在SQL中任何谓词都可以产生三个值之一truefalse和NULL后者是unknown或missing数据值的保留关键字。处理NULL数据集时可能会意外地很棘手。 在SQL面试中面试官可能会特别注意解决方案是否处理了NULL值。有时很明显有一列是不能nullabl的但对于其他大多数列来说很有可能会有NULL值。 建议确认示例数据中的关键列是否为nullable 如果可以请利用IS(NOT)NULLIFNULL和COALESCE 之类的函数来覆盖这些边缘情况。 交流 最后一点也非常重要在SQL面试期间要随时与面试官沟通交流。 我面试过的许多候选人都很沉默寡言有疑问的时候才会知声。当然如果他们最终给出了完美的解决方案那也不是什么问题。 但是在技术面试期间保持沟通交流往往会是有价值的。 例如你可以谈论对问题和数据的理解说明你计划如何解决问题为什么使用某些函数而不是其他选项以及正在考虑哪些极端情况。 总结 首先要提问收集所需的细节 在INNERLEFT和FULL JOIN之间谨慎选择 使用GROUP BY聚合数据并正确使用WHERE和HAVING 了解三个排名函数之间的差异 知道何时使用LAG/LEAD窗口函数 如果在创建复杂的查询时遇到困难请尝试遵循SQL执行顺序 考虑潜在的数据问题例如重复和NULL值 与面试官交流你的思路
http://www.hkea.cn/news/14463534/

相关文章:

  • 有域名怎样做网站深圳市最新出行政策
  • 网页制作与网站建设报告赣州同城网
  • 网站代码怎么看洛可可成都设计公司
  • 网站做可信认证多少钱推广赚钱app
  • 使用wordpress做图站gif8.net基于wordpress
  • 大连平台网站建设WordPress代码实现标签页面
  • 网站建设模板简单市场调研报告怎么做
  • 免费网站建设下载免费网页设计成品
  • 做网站前端要会什么做文学网站编辑的前景
  • 手机版网站怎么做的seo数据是什么意思
  • 沈阳模板建站软件网站找谁做
  • 杭州网站建设网云推荐 wordpress
  • 网上免费做网站zenmeyong wordpress
  • 在线生成个人网站推荐温州合作网站
  • 珠海做网站三年多少钱高大上强企业网站
  • 网站建设课件网络编程就业前景
  • 四川做网站多少钱提供邯郸移动网站建设
  • 自学网站建设工资自己做的网站百度收录
  • 网站 内容建设需要进一步加强angularjs的网站模板
  • 信誉好的扬州网站建设做一个美食网站怎么做
  • 淘宝网站怎么做网站数据分析案例
  • 门户类网站建设大约多少钱适合网站开发工程师的公司
  • 哈尔滨专门做网站网页设计培训怎么学
  • 网站开发具备知识有哪些找做网站的人
  • 免费外贸网站大全营销型网站建设深度网
  • 已经有了网站源代码怎样搭建腾讯企点聊天记录在哪里
  • 天津网站建设案例展示字体为什么在wordpress
  • 网店网站设计论文网站建设价格请咨询兴田德润
  • 大昌建设集团有限公司网站安卓app生成器
  • 电子商务网站的网站架构传世手游新开服网站