搜索内容

包含标签:hive 的文章
  • 一些常用的hive sql函数
    云计算

    一些常用的hive sql函数

    1. with...as语句 with 语句,允许hive定义一个sql片段,供整个sql使用,会将这个片段产生的结果集保存在内存中,后续的sql均可以访问这个结果集,作用与视图……
    admin 2021-11-29
  • 两条华子也换不来的数据湖讲解
    云计算

    两条华子也换不来的数据湖讲解

    前言 数据湖一词进入我的视野是两年前,我记得当时是我们老板给做了DataBricks的技术分享报告,那个时候其实是介绍Spark的一些新特性,然后顺便介绍了数据湖……
    admin 2021-11-28
  • 什么是拉链表,并通过hive进行实现
    云计算

    什么是拉链表,并通过hive进行实现

    拉链表产生背景 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 1、数据量比较大; 2、表中的部分字段会被update,如用户的地址,产品的描述信息,……
    admin 2021-11-27
  • 数据仓库-学习理解
    云计算

    数据仓库-学习理解

    概要:数据仓库是一个过程而不是一个项目;是一个环境而不是一件产品。 数据仓库将多个数据源的数据按照一定主题集成起来,经过抽取、清洗、转换。整合后的……
    admin 2021-11-24
  • Hive:数据进行替换切分后的结果保存为新表,新表进行分词
    云计算

    Hive:数据进行替换切分后的结果保存为新表,新表进行分词

    文章目录 1、了解数据 2、处理数据 2.1 替换函数:regexp_replace 2.2 用split 进行切分数据 3、jieba 分词 ① Hive 数据管理、内外表、安装模式……
    admin 2021-11-22
  • Hive从本质到实战
    云计算

    Hive从本质到实战

    Hive 本质 将 HQL 转化成 MapReduce 程序 本人理解是使用HQL去写MapReduce Hive 处理的数据存储在 HDFS Hive 分析数据底层的实现是 MapReduce 执……
    admin 2021-11-21
  • 企业微信会话存档
    区块链

    企业微信会话存档

    为保障客户服务质量、提高内部协作效率和监管合规等原因,企业微信提供会话内容存档功能,也就是聊天记录监控。 哪些行业需要会话存档服务? 1、保险企业:销……
    admin 2021-11-20
  • Hive中MySQL数据库的安装及绑定
    云计算

    Hive中MySQL数据库的安装及绑定

    Hive中MySQL的安装及绑定 Hive 默认使用的元数据库为 derby,开启 Hive 之后就会占用元数据库 derby数据库只支持单用户访问且不与其他客户端共享数据 MySQL……
    admin 2021-11-19
  • SparkStreaming读取Kafka数据源
    云计算

    SparkStreaming读取Kafka数据源

    SparkStreaming读取Kafka数据源 一、前提工作 二、实验内容 一、前提工作 安装了zookeeper 安装了Kafka 实验环境:kafka_2.11-2.3.1.tgz + zookee……
    admin 2021-11-19
  • 【Linux】Hive无法插入数据
    云计算

    【Linux】Hive无法插入数据

    [2021-11-08 11:30:08.454]Container [pid=6936,containerID=container_1636331971860_0002_01_000007] is running 2320286728 beyond the 'VIRTUAL' memory ……
    admin 2021-11-16