包含标签:hive 的文章
-
Hive SQL初级练习(30题)
前言 Hive 的重要性不必多说,离线批处理的王者,Hive 用来做数据分析,SQL 基础必须十分牢固。 环境准备 建表语句 这里建4张表,下面的练习题都用这些数据。…… -
-
【Hive SQL】统计同名路径下目录数量(基于reverse、split和substr函数)
首先,Hive事务表所产生的的路径信息如下: PS:其中路径信息格式为 /user/hive/warehouse/${database_name}.db/${table_name}/* /user/hive/warehouse/test…… -
【hive】列转行—collect_set()/collect_list()/concat_ws()函数的使用场景
文章目录 一、collect_set()/collect_list() 二、实际运用 把同一分组的不同行的数据聚合成一个行 用下标可以随机取某一个 聚合后的中的值用‘|’分隔开 使…… -
max min greatest least的详解以及用法
1.区别: 1 max和min是聚合函数,如果使用一般需要同步跟一个group by 而greatest 和least则不需要。如果greaat 和least 后面直接group by则会报错. 2 min,…… -
Hive on Spark (1)
spark中executor和driver分别有什么作用? Spark中Executor 在 Apache Spark 中,Executor 是分布式计算框架中的一个关键组件,用于在集群中执行具体的计算…… -
Hive概述
Hive 一 Hive基本概念 1 Hive简介 学习目标 - 了解什么是Hive - 了解为什么使用Hive ####1.1 什么是 Hive Hive 由 Facebook 实现并开源,是基于 Hadoop…… -
[sqoop]导入数据
一、覆盖导入 例如维度表,每次导入的数据需要覆盖上次导入的数据。 hive-overwrite参数:实现覆盖导入 hive-import参数:表示向hive表导入 hive-table参数:…… -
-
kettle之数据库连接-Generic database连接hive(CDH版)
版本:kettle7.1、hive-common-1.1.0-cdh5.5.0 目录 1、创建连接 2、org/apache/thrift/TException 3、org.apache.hadoop.conf.Configuration 1、创建连接 ……