Hive元数据信息获取
创始人
2024-05-29 11:13:22
0
  • 如何获取Hive库表字段分区信息

1 获取Hive的所有数据库信息

如果注释字段中文乱码,则需要修改字符集(正常情况都需要修改)。

SELECT`NAME` NAME,ANY_VALUE ( `DESC` ) COMMENT,ANY_VALUE ( `DB_LOCATION_URI` ) path 
FROM`DBS` 
GROUP BY`NAME

2 根据数据库名获取数据表信息

path字段对应着Hive表在Hdfs的路径,在做数据同步的时候很重要(比如使用dataX进行数据同步,当然手写JSON也是很累的,但是还好有datax-web开源项目),type字段可以看出表的储存格式(目前已知Hive可以直接加载Hdfs目录中的text格式parquet格式文件)。

SELECTtb.TBL_NAME NAME,tp.PARAM_VALUE COMMENT,sds.INPUT_FORMAT type,sds.LOCATION path 
FROMDBS dbLEFT JOIN TBLS tb ON tb.DB_ID = db.DB_IDLEFT JOIN TABLE_PARAMS tp ON tp.TBL_ID = tb.TBL_ID AND tp.PARAM_KEY = 'comment'LEFT JOIN SDS sds ON sds.SD_ID = tb.SD_ID 
WHEREdb.`NAME` = 'test'
ORDER BYtb.TBL_NAME

3 根据数据库名、数据表名获取表字段信息

此处查询结果只会展示表的字段信息(分区字段不会在该查询语句的结果中显示)。

SELECTcol.COLUMN_NAME NAME,col.TYPE_NAME type,col.`COMMENT` COMMENT,col.INTEGER_IDX position 
FROMDBS dbLEFT JOIN TBLS tb ON tb.DB_ID = db.DB_IDLEFT JOIN SDS sds ON sds.SD_ID = tb.SD_IDLEFT JOIN COLUMNS_V2 col ON sds.CD_ID = col.CD_ID 
WHEREdb.NAME = 'test' AND tb.TBL_NAME = 'person'
ORDER BYcol.INTEGER_IDX

4 根据数据库名、数据表名获取表分区信息

至于分区字段为什么单独拿出来不合到表字段里,是因为每个分区对应着一个Hdfs目录。分区有目录,字段没有啊怎么能放到一起。(在使用datax同步分区数据时会将分区数据同步到分区表指定的分区目录中)。

4.1 查看分区表分区字段信息

创建一个分区表用年、月、日三级目录进行分区:

create table if not exists person_partition(name string comment '姓名',age  int comment '年龄'
) comment '测试表'
partitioned by (year string comment '年',month string comment '月',day string comment '日'
)
stored as parquet;
SELECTpk.PKEY_NAME NAME,pk.PKEY_TYPE type,pk.PKEY_COMMENT COMMENT,pk.INTEGER_IDX position 
FROMDBS dbLEFT JOIN TBLS tb ON tb.DB_ID = db.DB_IDLEFT JOIN PARTITION_KEYS pk ON pk.TBL_ID = tb.TBL_ID 
WHEREdb.`NAME` = 'test' AND tb.TBL_NAME = 'person_partition' 
ORDER BYpk.INTEGER_IDX

4.2 查看分区表的分区信息

当前表中还没有分区,先来加几个分区:

  • 添加分区【同时会在Hdfs中创建目录】:alter table [table] add partition(col,..);
  • 删除分区【同时会在Hdfs中删除目录】:alter table [table] drop partition(col,..);
alter table person_partition add if not exists partition(year=2015,month=12,day=26);
alter table person_partition add if not exists partition(year=2016,month=12,day=26);
alter table person_partition add if not exists partition(year=2017,month=12,day=26);
alter table person_partition add if not exists partition(year=2018,month=12,day=26);
alter table person_partition add if not exists partition(year=2019,month=12,day=26);
alter table person_partition add if not exists partition(year=2020,month=12,day=26);

接下来查询下分区表的分区信息,看看每个分区对应的Hdfs路径(使用datax数据同步时将会使用到):

SELECTdb.`NAME` dbName,tb.TBL_NAME tbName,part.PART_NAME partName,sds.LOCATION path 
FROM`PARTITIONS` partLEFT JOIN TBLS tb ON tb.TBL_ID = part.TBL_IDLEFT JOIN DBS db ON db.DB_ID = tb.DB_IDLEFT JOIN SDS sds ON sds.SD_ID = part.SD_ID 
WHEREdb.`NAME` = 'test' AND tb.TBL_NAME = 'person_partition'

附录

A.1 Hive元数据中文乱码

hive配置表的元数据放到mysql中存储,mysql中默认表被创建的时候用的是默认的字符集(latin1),所以会出现中文乱码。

解决方案:

(1)在Hive元数据存储的Mysql数据库(MetaStore)中,执行以下SQL:

#修改字段注释字符集
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
#修改表注释字符集
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
#修改分区参数,支持分区建用中文表示
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(20000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(20000) character set utf8;
#修改索引名注释,支持中文表示
alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
#修改视图,支持视图中文
ALTER TABLE TBLS modify COLUMN VIEW_EXPANDED_TEXT mediumtext CHARACTER SET utf8;
ALTER TABLE TBLS modify COLUMN VIEW_ORIGINAL_TEXT mediumtext CHARACTER SET utf8;

(2)修改hive-site.xml中Hive读取元数据的编码(注意原先是否配置过)

javax.jdo.option.ConnectionURLjdbc:mysql://hadoop102:3306/metastore?useSSL=false&useUnicode=true&characterEncoding=UTF-8

注意的是,之前创建的表的元数据已经损坏了,所以无法恢复中文乱码,只能重新创建表

相关内容

热门资讯

安卓系统有哪些机型好,探索顶级... 你有没有想过,安卓系统里的手机型号那么多,哪一款才是最适合你的呢?别急,今天我就来给你好好盘点看看安...
安卓系统之间如何互传,安卓设备... 你是不是也和我一样,手机里存了那么多好东西,却苦于不能和好友分享呢?别急,今天就来教你怎么用安卓系统...
安卓系统启动修改工具,安卓系统... 你有没有想过,你的安卓手机启动速度竟然可以像火箭一样快?没错,这就是今天我要跟你分享的神秘工具——安...
安卓系统版本号历史,从初生到繁... 你有没有发现,每次打开手机,那系统版本号总是一闪而过,好像在悄悄告诉你:“我可是有故事的哦!”今天,...
小米改安卓系统软件,安卓系统软... 你知道吗?最近小米手机界可是掀起了一阵小小的风波呢!那就是小米对安卓系统软件的一次大改版。这可不是什...
安卓系统控制流量app,安卓系... 你有没有发现,手机里的流量就像小河里的水,不知不觉就流光了?别急,今天就来给你揭秘一款神奇的安卓系统...
hl2240安卓系统,功能解析... 你有没有发现,最近你的手机系统更新换代的速度简直就像坐上了火箭呢?今天,就让我带你来一探究竟,看看这...
iqoo刷原生安卓系统,还原纯... 最近手机圈里可是热闹非凡呢!一款名为iqoo的新品手机,凭借其强大的性能和独特的刷机功能,吸引了无数...
安卓系统我的读书入口,我的读书... 亲爱的手机控们,你是否也有这样的体验:每天手机不离手,却总是找不到心仪的读书应用?别急,今天我要给你...
搭载安卓9系统的手机,新一代智... 你有没有发现,最近市面上新出的手机,好像都开始搭载安卓9系统了呢?这可真是让人眼前一亮啊!今天,就让...
电脑模拟安卓系统win7系统,... 你有没有想过,如果电脑也能像手机一样,随时随地都能玩各种游戏、看视频呢?想象你坐在电脑前,屏幕上突然...
华为系统如何退回安卓,轻松实现... 你有没有想过,手机系统就像是我们生活中的衣服,有时候穿久了,就想换一件新的。比如,你之前用了华为的系...
安卓系统定制防沉迷手机,安卓手... 你有没有发现,现在的手机越来越智能,但随之而来的是沉迷于手机的问题也越来越严重,尤其是对青少年来说。...
安卓系统手机顶部符号,功能解析... 你有没有注意到,每次拿起安卓系统手机,顶部那一排小小的符号总是默默守护着你的屏幕?它们就像是一群小精...
美团餐饮系统安卓版,尽享美食新... 你有没有发现,最近点外卖的时候,手机上那个美团餐饮系统安卓版真是越来越方便了!今天,就让我带你来好好...
新生活cms安卓系统进货系统,... 你知道吗?最近市面上出现了一个超级酷的新玩意儿——新生活CMS安卓系统进货系统!这可是个让商家们眼睛...
安卓系统ai文章生成,探索安卓... 你知道吗?现在手机界的风云变幻,安卓系统可是当之无愧的王者!而且,最近听说安卓系统里还悄悄加入了AI...
推荐安卓车载导航系统,安卓平台... 你有没有想过,开车的时候,如果没有导航系统,那可真是像在茫茫大海中航行,没有指南针的感觉呢?别急,今...
安卓系统的地图怎样下载,下载与... 你有没有发现,现在不管去哪里,手机地图都成了我们的好帮手?尤其是安卓系统的地图,功能强大,用起来超级...
安卓9.0系统挂机游戏,轻松享... 你有没有发现,自从安卓9.0系统更新后,手机里的游戏体验简直就像坐上了火箭!今天,就让我带你一起探索...