Hive高阶聚合函数用法示例

这篇文章主要为大家展示了“Hive高阶聚合函数用法示例”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hive高阶聚合函数用法示例”这篇文章吧。

      如果需要多维度做一些指标统计,数据量比较大的话,我们一般会选择olap引擎,比如kylin等,但是如果数据量不是很大的话,hive也是可以实现的。

create table wedw_tmp.hive_function_test_df

(

 province_name       string        comment '省份名称'

,city_name           string        comment '城市名称'

,area_name           string        comment '地区名称'

,people_cnt          int           comment '人口数量'

,amt                 decimal(16,2) comment 'GDP'

)

row format delimited fields terminated by ','

广东,广州,白云区,100,30

广东,广州,番禺区,120,45

广东,深圳,福田区,200,67

广东,深圳,南山区,290,100

浙江,杭州,萧山区,80,20

浙江,杭州,滨江区,120,50

浙江,宁波,江东区,80,23

浙江,宁波,江北区,45,5

select * from  wedw_tmp.hive_function_test_df;

Hive高阶聚合函数用法示例  hive 第1张

一 with cube

select

 province_name

,city_name    

,area_name 

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by 

 province_name

,city_name    

,area_name 

with cube

;  

Hive高阶聚合函数用法示例  hive 第2张

二 grouping sets

select

 province_name

,city_name    

,area_name 

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by 

 province_name

,city_name    

,area_name 

grouping sets((),(province_name),(province_name,city_name))

;  

Hive高阶聚合函数用法示例  hive 第3张

三 with rollup

select

 province_name

,city_name    

,area_name 

,sum(people_cnt) as all_people_cnt

from

wedw_tmp.hive_function_test_df

group by 

 province_name

,city_name    

,area_name 

with rollup

;  

Hive高阶聚合函数用法示例  hive 第4张

以上是“Hive高阶聚合函数用法示例”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注蜗牛博客行业资讯频道!

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:niceseo99@gmail.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

评论

有免费节点资源,我们会通知你!加入纸飞机订阅群

×
天气预报查看日历分享网页手机扫码留言评论电报频道链接