spark

包含标签：spark 的文章

云计算

SparkStreaming读取kafka生产的数据，进行累计词频统计后将最新结果存入MySQL数据库

SparkStreaming读取kafka生产的数据，进行累计词频统计后将最新结果存入MySQL数据库一、环境准备二、环境启动三、编写程序四、进行测试读取kafka数……

admin 2021-11-25

0
云计算

参考 Apache Spark 的源码自定义实现 Logging 日志打印工具

前言本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和……

admin 2021-11-23

0
云计算

Spark SQL 内置函数（二）Map Functions（基于 Spark 3.2.0）

前言本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和……

admin 2021-11-23

0
云计算

Scala 的代码风格怎么统一？这份 scalastyle 配置你可以无脑复制

前言本文隶属于专栏《1000个问题搞定大数据技术体系》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！本专栏目录结构和……

admin 2021-11-23

0
云计算

SparkStreaming读取Kafka数据源

SparkStreaming读取Kafka数据源一、前提工作二、实验内容一、前提工作安装了zookeeper 安装了Kafka 实验环境：kafka_2.11-2.3.1.tgz + zookee……

admin 2021-11-19

0
架构

bigdata_kafka与streaming

一丶Kafka应用鉴于kafka在实际使用时，绝大多数应用场景均为Producer和Consumer的API配合使用，故在此只介绍这两种API操作方法，其它的Connector和Str……

admin 2021-11-19

0
研发管理

Spark综合学习笔记（三）搜狗搜索日志分析

学习致谢： https://www.bilibili.com/video/BV1Xz4y1m7cv?p=36 一、数据数据网站： http: //www.sogou.com/labs/resource/q.php 二、需求针对SougoQ……

admin 2021-11-18

0
云计算

安装elasticsearch集群

认识elasticsearch 最近在做一个关于spark整合Elasticsearch的项目，闲暇时便在自己机器上安装了一下elasticsearch集群。关于elasticserarch，这里简单做一……

admin 2021-11-15

0
研发管理

Spark开发环境搭建

夫君子之行，静以修身，俭以养德，非淡泊无以明志，非宁静无以致远。夫学须静也，才须学也，非学无以广才，非志无以成学。淫慢则不能励精，险躁则不能冶性……

admin 2021-11-14

0
云计算

Spark（一）：基础

Spark 概述什么是Spark Spark是一种基于内存的快速，通用，可扩展的大数据分析计算引擎 Spark 是一种由 Scala 语言开发的快速、通用、可扩展的大数据分析……

admin 2021-11-12

0