包含标签:hadoop 的文章
-
启动hadoop后jps查看到没有data进程
如果data进程不存在,那就可能是因为name的格式化让datanode的clusterID 和 namenode的clusterID 不匹配,需要自己手动进入data修改配置,让两者的id一致。 …… -
HBaes shell输入命令报错:hbase ERROR: Can‘t get master address from ZooKeeper; znode data == null
解决方法:删除各个节点hbase自动生成的zookeeper文件(当使用的zookeeper时habse自带的时候),若是不可以还可以再尝试将hadoop中hbase的的目录删除 删除hba…… -
调用MapReduce对文件中各个单词出现的次数进行统计
要求: 1.将待分析的文件(不少于10000英文单词)上传到HDFS。 2.调用MapReduce对文件中各个单词出现的次数进行统计。 3.将统计结果下载本地。 作业分析: 我…… -
Hive常用函数
Hive常用函数 功能 用Hive计算的话,主要是通过Hive将SQL转换为MR/Spark/Tez程序,很少用,有很多的替代品来实现(Presto、Impala、SparkSQL) 思考?:替代软…… -
大数据学习教程SD版第八篇【DataX】
DataX 采用Java编写的工具,使用Python调用功能,修改JSON配置即可使用 数据同步工具 支持:异构数据源、HDFS等 插件式 常用的数据源:MySQL、SQLServer、HD…… -
-
-
使用DBeaver远程连接hive数据库
目录 一、连接步骤 1.DBeaver连接hive数据库时需要先在服务器启动hive的metastore服务和hiveserver2服务 2.启动之后通过jps命令查看两个RunJar服务是否启动成…… -
Hive之查询操作
目录 一、查询总述 select执行顺序 二、基本查询 重命名 算术运算符 常用函数 Limit语句 Where语句 比较运算符 Like和RLike 逻辑运算符 三、分组查询 Group B…… -
day06Hadoop环境搭建之克隆两个从节点node
在分布式存储系统中,分散在不同节点中的数据可能属于同一个文件。为了组织众多的文件,把文件可以放到不同的文件夹中,文件夹可以一级一级的包含。我们把……