衡水 网站建设,wordpress文件权限,个人网站开发教程,英语网站开发什么时候需要数据仓库#xff1f;
1.当决策者要进行战略分析或者展示统计的需求。
2.并且数据量非常庞大#xff0c;而且各个都是数据孤岛。
当满足这2个条件后#xff0c;就需要搭建数据仓库。
数据仓库的第一步#xff08;数据清洗#xff09;
为了能准确的分析
1.当决策者要进行战略分析或者展示统计的需求。
2.并且数据量非常庞大而且各个都是数据孤岛。
当满足这2个条件后就需要搭建数据仓库。
数据仓库的第一步数据清洗
为了能准确的分析需要将各个业务系统的数据汇总在一起进行分析 数据仓库第一步所遇到的3个问题 注意关键点面试中和从0-1搭建中会遇到的问题 1.数据字段不同比如字段名称多个业务系统的叫法不一样有叫name、user_name、也有nike_name的 2.数据值有歧义比如医疗系统中同一种病的诊断结果由于人为手写有叫Hiv、艾滋病、获得性免疫缺陷综合征的 3.数据非唯一比如商城你们想统计每个人消费总额是多少但是你们有3个系统淘宝有一套京东有一套拼多多有一套怎么样确定唯一的用户 这是我工作5年来别人问到的以及自己遇到的问题那么遇到这种情况应该怎么办 所以说在把数据备份一份到ods层后核心第一步绝对是先进行【数据清洗】 数据清洗对应的解决方案