ODS层怎样搭建数仓

2025-12-12 05:36:43

1、创建数据库

1)创建gmall数据库

ODS层怎样搭建数仓

2、说明:如果数据库存在且有数据,需要强制删除时执行:drop database gmall cascade;

2)使用gmall数据库

ODS层怎样搭建数仓

3、ODS层

原始数据层,存放原始数据,直接加载原始日志、数据,数据保持原貌不做处理。

ODS层怎样搭建数仓

4、1)创建输入数据是lzo输出是text,支持json解析的分区表

ODS层怎样搭建数仓

5、说明Hive的LZO压缩

2)加载数据

ODS层怎样搭建数仓

6、注意:时间格式都配置成YYYY-MM-DD格式,这是Hive默认支持的时间格式

3)查看是否加载成功

ODS层怎样搭建数仓

7、创建事件日志表ods_event_log

ODS层怎样搭建数仓

8、1)创建输入数据是lzo输出是text,支持json解析的分区表

ODS层怎样搭建数仓

9、2)加载数据

ODS层怎样搭建数仓

10、注意:时间格式都配置成YYYY-MM-DD格式,这是Hive默认支持的时间格式

3)查看是否加载成功

ODS层怎样搭建数仓

11、Shell中单引号和双引号区别

1)在/home/atguigu/bin创建一个test.sh文件

ODS层怎样搭建数仓

12、在文件中添加如下内容

ODS层怎样搭建数仓

13、2)查看执行结果

ODS层怎样搭建数仓

14、3)总结:

(1)单引号不取变量值

(2)双引号取变量值

(3)反引号`,执行引号中命令

(4)双引号内部嵌套单引号,取出变量值

(5)单引号内部嵌套双引号,不取出变量值

15、ODS层加载数据脚本

1)在hadoop102的/home/atguigu/bin目录下创建脚本

ODS层怎样搭建数仓

16、在脚本中编写如下内容

ODS层怎样搭建数仓

17、说明1:

[ -n 变量值 ] 判断变量的值,是否为空

-- 变量的值,非空,返回true

-- 变量的值,为空,返回false

说明2:

查看date命令的使用,[atguigu@hadoop102 ~]$ date --help

18、2)增加脚本执行权限

ODS层怎样搭建数仓

19、3)脚本使用

ODS层怎样搭建数仓

20、4)查看导入数据

ODS层怎样搭建数仓

21、5)脚本执行时间

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢