Hadoop怎样修改hive分区信息

2025-10-14 20:20:39

1、先查看test表的创建语句:show create table test;

找出表的源数据所存放的hdfs路径:/user/hive/radius/test

Hadoop怎样修改hive分区信息

2、打开hdfs路径:查看test表的分区

Hadoop怎样修改hive分区信息

3、当然也可在命令行中使用: show partitions test;  查看多少个分区,但是相对命令行中网页上更加直观一些;

4、复制需要修改的分区路径,然后在命令行中使用shell命令修改:

例如:province_id=105分区要修改成province_id=hunan;

复制分区路径: /user/hive/radius/test/province_id=105

在命令行中修改hdfs文件名称:

dfs -mv /user/hive/radius/test/province_id=105    /user/hive/radius/test/province_id=hunan;

Hadoop怎样修改hive分区信息

5、修复分区源数据,

在命令行执行: MSCK REPAIR TABLE test;

Hadoop怎样修改hive分区信息

6、如果hive表分区数据比较多的话时间可能稍微长些,耐心等待就行了!

Hadoop怎样修改hive分区信息

7、显示此页面的话就代表修复成功。

8、检查数据是否修改成功:

 select * from test where province_id = 'hunan' limit 5;

Hadoop怎样修改hive分区信息

9、检查数据是否有遗漏:

select count(*) from test where province_id = 'hunan';

Hadoop怎样修改hive分区信息

10、修改成功,如果是复制分区数据到其他表的话跟以上步骤一样,只不过把修改hdfs文件名称改成复制hdfs文件。

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢