big data

包含标签：big data 的文章

人工智能

灰度·亞太与深圳大豪超算达成战略合作 ——推进亚太地区数字化发展

2021年11月12日，灰度·亞太与大豪超算达成品牌战略合作，双方代表完成战略合作签约。这将标志着数字资产行业头部实力品牌灰度·亞太集團正式在亚太地区开展业……

admin 2021-11-14

0
云计算

Hive（HQL）数据库

Hive的特点 Hive与SQL语句相像能将SQL语句转变成MapReduce任务来执行 Hive要依赖于yarn 只能用于结构化 Hive只能处理离线数据，处理大型数据 Hive在集群……

admin 2021-11-13

0
云计算

大数据之路——数据同步

三、数据技术篇—— 数据同步 3.1 数据同步基础 @ 3.1.1 直连同步 3.1.2 数据文件同步 3.1.3 数据库日志解析同步 3.2 数据仓库同步方式 3.2.1 批量数……

admin 2021-11-13

0
区块链

2021-11-12元宇宙到底是什么？是风口？还是户口？

随着Facebook宣布正式改名为"Meta"，迅速蹿红的元宇宙概念再次掀起关注热潮.元宇宙到底是什么？是风口还是户口？我们应该如何看待元宇宙？据红星资本局11月1……

admin 2021-11-13

0
" alt="数据采集是工业互联网的基础，物联网助力企业数字化转型提质增效">

物联网

数据采集是工业互联网的基础，物联网助力企业数字化转型提质增效

数据采集是工业互联网的基础，没有数据的工业互联网将是无源之水。车间是制造企业使用与产生数据的重要场所，一个真正的数字化工厂，对内外部数据、系统和流……

admin 2021-11-12

0
云计算

大数据之 Flume 对接 Kafka 完整使用 (第六章)

大数据之 Flume 对接 Kafka 完整使用一、Flume 对接 Kafka 1）配置 flume(flume-kafka.conf) 2）启动 kafkaIDEA 消费者 3）进入 flume 根目录下，启……

admin 2021-11-12

0
云计算

Spark（一）：基础

Spark 概述什么是Spark Spark是一种基于内存的快速，通用，可扩展的大数据分析计算引擎 Spark 是一种由 Scala 语言开发的快速、通用、可扩展的大数据分析……

admin 2021-11-12

0
云计算

Kafka概述

Kafka概述 Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统。 Zookeeper在Kafka中扮演的角色，进行Ka……

admin 2021-11-11

0
云计算

2021SC@SDUSC hadoop源码分析（七）

2021SC@SDUSC 本篇我将对hadoop-tools中的Gridmix进行分析 GridMix 概念 GridMix是Hadoop集群的基准。它提交多种合成作业，对从生产负载中挖掘的概要进行建模……

admin 2021-11-11

0
云计算

Hadoop新增节点后HDFS数据均衡操作

前置设置: 数据均衡带宽优化 #参数说明：设置balance工具在运行中所能占用的带宽，需反复调试设置为合理值, 过大反而会造成MapReduce流程运行缓慢 #CDH集……

admin 2021-11-11

0