网站推广关键词工具,泸州市住房和城乡建设局网站,网站前端工程师,在线ftp传网站文件在数字化转型的战略实施中#xff0c;很多企业都在搭建自己的业务、数据及人工智能的中台。在同这些企业合作和交流中#xff0c;越来越体会到数据目录是中台建设的核心和基础。为了更好地提供数据服务#xff0c;发挥数据价值#xff0c;用户需要先理解数据和信任数据。 企…在数字化转型的战略实施中很多企业都在搭建自己的业务、数据及人工智能的中台。在同这些企业合作和交流中越来越体会到数据目录是中台建设的核心和基础。为了更好地提供数据服务发挥数据价值用户需要先理解数据和信任数据。 企业拥有什么样的数据这些数据在哪里这些数据之间的关系及沿袭数据是好是坏这些都是数据目录需要回答的问题。 企业的数据环境具有复杂和多样性数据分散在成百上千的本地和云端系统之中其中包括传统的事务性数据库、大数据平台或者数据湖、基于云的市场营销等系统还有不断涌现的新数据源和应用。人工智能和机器学习可使数据目录 “智能化”使其具备自动发现自动数据分类自动分析和关联的能力不断满足企业数据管理在处理规模、效率、创新和洞察力等方面的需求。
IBM很早就认识到将机器学习应用到数据管理的重要性在IBM的Cloud Pak for Data中机器学习无处不在遍布数据集成、自动化数据管理、多云数据整合、数据准备、建议和数据洞察其中Watson Knowledge Catalog致力于改进企业中数据管理者和数据使用者之间的数据流的通信、集成和自动化被评为机器学习数据目录领导者。
1. 自动数据发现快速构建数据目录
应对企业复杂和多样的数据环境智能的数据目录可以自动快速地发现数据并进行识别包括数据的轮廓数据的业务含义数据的分类数据的质量数据集之间的关系是否有隐私或者敏感的数据能快速地创建数据目录高效地提供数据准备。 2. 关联数据资产完整知识图谱
企业的各种信息不是孤立的个体之间存在各种的关系例如业务分类同业务术语业务术语同技术资产业务规则同技术规则及数据资产数据分类同数据资产数据资产同数据管家等的关系。对于需要理解数据的用户希望从任一个关注点出发获取到与其相关的业务上、技术上、管理上等维度的关联的资产信息。
智能的数据目录先将企业中存在于系统、流程和集体知识中的各类信息集合在一起分析并关联将企业的各类数据资产以关系图的形式展开对于每个用户可以从中截取自己关注的片段并可以随信息的拓展而继续探索和发现新的知识从而更好地理解数据丰富自己的数据知识体系。 3. 自动数据校验提升数据质量
在理解数据后若要使用数据需要进一步信任数据。数据质量是数据信任的基石需提供细粒度的量化的数据质量监管和变化追踪除了内置多种数据质量维度自动进行数据质量打分外还需要提供根据数据分类、业务特征、重要性等特定属性自动进行相关的数据规则校验而不需要考虑数据的来源大大提高数据管理的效率和范围。
4. 自动分析数据沿袭
用户需要对其数据细致了解才能对数据更加自信和笃定才能支撑分析和数据科学。
智能的数据目录能支撑从大量数据源中提取粗粒度—系统和系统之间的数据集和和数据集合之间沿袭同时支持细粒度—表和表之间字段和字段之间的沿袭关系。 5. 智能搜索
无论是业务用户或者技术用户无论数据处于企业什么位置或者搜索时候输入模糊或者近似的信息用户都能搜索到相应的结果及大量相关联的信息。这些搜索结果会按照信息相关性从高到底给出。用户还可以在图形化的搜索对象上进行深入的展开和探查。对于搜索到的数据资产用户可以预览数据了解数据轮廓进行数据可视化查看为后续的数据分析和建模准备数据。 智能的数据目录帮助用户揭示复杂的数据关系高效创建可信赖的分析基础平台从数据采集、数据治理到数据自助服务提供端到端的一站式平台服务。
详情请访问IBM官网页面了解更多内容IBM Knowledge Catalog