搜索内容

包含标签:hive 的文章
  • 入门用Hive构建数据仓库
    物联网

    入门用Hive构建数据仓库

    在当今数据爆炸的时代,构建高效的数据仓库是企业实现数据驱动决策的关键。Apache Hive 是一个基于 Hadoop 的数据仓库工具,可以轻松地进行数据存储、查询和……
    admin 2024-04-05
  • 大数据开发(Hive面试真题-卷三)
    5G

    大数据开发(Hive面试真题-卷三)

    大数据开发(Hive面试真题) 1、Hive的文件存储格式都有哪些? 2、Hive的count的用法? 3、Hive得union和unionall的区别? 4、Hive的join操作原理,left jo……
    admin 2024-03-22
  • (01)Hive的相关概念——架构、数据存储、读写文件机制
    架构

    (01)Hive的相关概念——架构、数据存储、读写文件机制

    目录 一、架构及组件介绍 1.1 Hive整体架构 1.2 Hive组件 1.3 Hive数据模型(Data Model) 1.3.1 Databases 1.3.2 Tables 1.3.3 Partitions 1.3.4 Buckets 二……
    admin 2024-02-19
  • ​(三)hadoop之hive的搭建1
    研发管理

    ​(三)hadoop之hive的搭建1

    下载 访问官方网站https://hive.apache.org/ 点击downloads 点击Download a release now! 点击https://dlcdn.apache.org/hive/ 选择最新的稳定版 ……
    admin 2024-02-09
  • 删除和清空Hive外部表数据
    研发管理

    删除和清空Hive外部表数据

    外部表和内部表区别 未被external修饰的是内部表(managed table),被external修饰的为外部表(external table); 区别: 内部表数据由Hive自身管理,外……
    admin 2024-02-08
  • 安装Hive
    物联网

    安装Hive

    主要使用远程模式部署hive的metastore服务。在node1机器上安装。 注意:以下两件事在启动hive之前必须确保正常完成。 1、提前安装mysql,确保具有远程访问的……
    admin 2024-02-03
  • Hive之set参数大全-22(完)
    物联网

    Hive之set参数大全-22(完)

    指定是否启用矢量化处理复杂数据类型 在 Hive 中,hive.vectorized.complex.types.enabled 是一个配置参数,用于指定是否启用矢量化处理复杂数据类型。以下……
    admin 2024-02-03
  • 大数据开发之Hive(压缩和存储)
    5G

    大数据开发之Hive(压缩和存储)

    第 9 章:压缩和存储 Hive不会强制要求将数据转换成特定的格式才能使用。利用Hadoop的InputFormat API可以从不同数据源读取数据,使用OutputFormat API可以……
    admin 2024-01-15
  • 数仓项目建设——思路及架构
    架构

    数仓项目建设——思路及架构

    离线数仓架构方案 经典传统数仓架构 阶段一: 1991年 比尔-恩门(bill inmon)出版第一版数据仓库的书, 标志数据仓库概念的确立, 称为恩门模型 主张自上而下……
    admin 2024-01-09
  • Hive02_基本使用,常用命令
    物联网

    Hive02_基本使用,常用命令

    一、Hive基本概念 1 什么是 Hive 1)hive 简介 Hive:由 Facebook 开源用于解决海量结构化日志的数据统计工具。 Hive 是基于 Hadoop 的一个数据仓库工具,……
    admin 2023-12-29