关于数据湖、数据仓库的想法

一:数据糊定义: 1、数据湖的出现,主要是为了去满足企业对原始数据的存储、管理和再加工的需求。首先要有一个低成本的存储,用于存储结构化、半结构化,甚至非结构化的数据;另外,有一套包括数据处理、数据管理以及数据治理在内的一体化解决方案。 2、从0到1搭建数据糊,原始数据存储在hdfs上,然后上层构建计
posted @ 2024-06-06 07:09  耗子哥信徒  阅读(3)  评论(0编辑  收藏  举报