包含标签:大数据--学习 的文章
-
Hive:数据进行替换切分后的结果保存为新表,新表进行分词
文章目录 1、了解数据 2、处理数据 2.1 替换函数:regexp_replace 2.2 用split 进行切分数据 3、jieba 分词 ① Hive 数据管理、内外表、安装模式…… -
Hive:分区原因、创建分区、静态分区 、动态分区
文章目录 1、为什么要分区? 2、如何分区以及细节 3、创建分区 4、静态分区 5、动态分区 ① Hive 数据管理、内外表、安装模式操作 ② Hive:用SQL对数…… -
Hive:用SQL对数据进行操作,导入数据、清洗脏数据、统计数据订单等等
文章目录 1、准备数据 2、了解数据 3、将数据导入hive 4、如何清洗第一行的脏数据? 4.1 方式一:shell命令 4.2 方式二:HQL (hive sql) 4.3 方式三:……