包含标签:big data 的文章
-
灰度·亞太与深圳大豪超算达成战略合作 ——推进亚太地区数字化发展
2021年11月12日, 灰度·亞太与大豪超算达成品牌战略合作,双方代表完成战略合作签约。这将标志着数字资产行业头部实力品牌灰度·亞太集團正式在亚太地区开展业…… -
Hive(HQL)数据库
Hive的特点 Hive与SQL语句相像 能将SQL语句转变成MapReduce任务来执行 Hive要依赖于yarn 只能用于结构化 Hive只能处理离线数据,处理大型数据 Hive在集群…… -
大数据之路——数据同步
三、数据技术篇—— 数据同步 3.1 数据同步基础 @ 3.1.1 直连同步 3.1.2 数据文件同步 3.1.3 数据库日志解析同步 3.2 数据仓库同步方式 3.2.1 批量数…… -
2021-11-12元宇宙到底是什么?是风口?还是户口?
随着Facebook宣布正式改名为"Meta",迅速蹿红的元宇宙概念再次掀起关注热潮.元宇宙到底是什么?是风口还是户口?我们应该如何看待元宇宙? 据红星资本局11月1…… -
数据采集是工业互联网的基础,物联网助力企业数字化转型提质增效
数据采集是工业互联网的基础,没有数据的工业互联网将是无源之水。 车间是制造企业使用与产生数据的重要场所,一个真正的数字化工厂,对内外部数据、系统和流…… -
大数据之 Flume 对 接 Kafka 完整使用 (第六章)
大数据之 Flume 对 接 Kafka 完整使用 一、Flume 对 接 Kafka 1)配置 flume(flume-kafka.conf) 2) 启动 kafkaIDEA 消费者 3) 进入 flume 根目录下,启…… -
Spark(一):基础
Spark 概述 什么是Spark Spark是一种基于内存的快速,通用,可扩展的大数据分析计算引擎 Spark 是一种由 Scala 语言开发的快速、通用、可扩展的大数据分析…… -
Kafka概述
Kafka概述 Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统。 Zookeeper在Kafka中扮演的角色,进行Ka…… -
2021SC@SDUSC hadoop源码分析(七)
2021SC@SDUSC 本篇我将对hadoop-tools中的Gridmix进行分析 GridMix 概念 GridMix是Hadoop集群的基准。它提交多种合成作业,对从生产负载中挖掘的概要进行建模…… -
Hadoop新增节点后HDFS数据均衡操作
前置设置: 数据均衡带宽优化 #参数说明:设置balance工具在运行中所能占用的带宽,需反复调试设置为合理值, 过大反而会造成MapReduce流程运行缓慢 #CDH集……