hadoop

包含标签：hadoop 的文章

云计算

启动hadoop后jps查看到没有data进程

如果data进程不存在，那就可能是因为name的格式化让datanode的clusterID 和 namenode的clusterID 不匹配，需要自己手动进入data修改配置，让两者的id一致。 ……

admin 2021-12-27

0
云计算

HBaes shell输入命令报错：hbase ERROR: Can‘t get master address from ZooKeeper； znode data == null

解决方法：删除各个节点hbase自动生成的zookeeper文件（当使用的zookeeper时habse自带的时候），若是不可以还可以再尝试将hadoop中hbase的的目录删除删除hba……

admin 2021-12-27

0
" alt="调用MapReduce对文件中各个单词出现的次数进行统计">

云计算

调用MapReduce对文件中各个单词出现的次数进行统计

要求： 1.将待分析的文件（不少于10000英文单词）上传到HDFS。 2.调用MapReduce对文件中各个单词出现的次数进行统计。 3.将统计结果下载本地。作业分析: 我……

admin 2021-12-26

0
云计算

Hive常用函数

Hive常用函数功能用Hive计算的话,主要是通过Hive将SQL转换为MR/Spark/Tez程序,很少用,有很多的替代品来实现(Presto、Impala、SparkSQL) 思考?:替代软……

admin 2021-12-26

0
云计算

大数据学习教程SD版第八篇【DataX】

DataX 采用Java编写的工具，使用Python调用功能，修改JSON配置即可使用数据同步工具支持：异构数据源、HDFS等插件式常用的数据源：MySQL、SQLServer、HD……

admin 2021-12-25

0
云计算

Hive之分区表和分桶表

目录一、分区表 1.分区表的基本操作 2.创建二级分区数据修复 3.动态分区二、分桶表一、分区表 Hive中的分区表就是分目录，分区表对应的就是HDFS……

admin 2021-12-25

0
云计算

【Hive】SQL处理各种场景问题（题）

SQL处理各种场景问题一、行列转换问题一：多行转多列问题二：如何将结果转成源表？（多列转多行）问题三：同一部门会有多个绩效，求多行转多列结果 ……

admin 2021-12-25

0
云计算

使用DBeaver远程连接hive数据库

目录一、连接步骤 1.DBeaver连接hive数据库时需要先在服务器启动hive的metastore服务和hiveserver2服务 2.启动之后通过jps命令查看两个RunJar服务是否启动成……

admin 2021-12-25

0
云计算

Hive之查询操作

目录一、查询总述 select执行顺序二、基本查询重命名算术运算符常用函数 Limit语句 Where语句比较运算符 Like和RLike 逻辑运算符三、分组查询 Group B……

admin 2021-12-24

0
云计算

day06Hadoop环境搭建之克隆两个从节点node

在分布式存储系统中，分散在不同节点中的数据可能属于同一个文件。为了组织众多的文件，把文件可以放到不同的文件夹中，文件夹可以一级一级的包含。我们把……

admin 2021-12-24

0