阿里云大数据工程师(ACP)认证考试大纲

阿里云大数据工程师(ACP)认证介绍

  阿里云大数据专业认证(ACP 级-Alibaba Cloud CertificationProfessional)是面向使用阿里云大数据产品的架构、开发、运维类人员的专业技术认证,主要涉及阿里云大数据类的几款核心产品,包括大数据计算服务MaxCompute、数据工场DataWorks、数据集成、Quick BI、机器学习 PAI等。通过该技术认证可以有效证明该认证人员具备以下能力:

  • 具备大数据的存储、处理、分析以及展现的基础知识
  • 能够根据企业的业务需求,基于阿里云的产品制定有效的技术解决方案和企业最佳实践
  • 能够熟练的使用阿里云的大数据计算服务 MaxCompute、数据工场
    DataWorks、数据集成、QuickBI 以及机器学习 PAI 等产品
  • 能够诊断基于阿里云大数据产品构建的业务系统在运行中出现的常见问题并找到相应的解决方案

  阿里云大数据专业认证主要包含两部分考核内容:线上动手实验和线下考场客
观题考试,需在领取证书之前完成实验,线下客观题考试需到报名的考场参加,完成实验且考试成绩达到及格分数线可获得阿里云大数据专业认证证书。


阿里云大数据专业认证的报名方式

  通过阿里云官网提供的入口进行在线报名:https://edu.aliyun.com/certification/acp02


阿里云大数据专业认证所需具备的知识

阿里云相关的知识

  • 熟悉阿里云大数据相关产品的基本概念,包括大数据计算服务MaxCompute、数据工场 DataWorks、数据集成、QuickBI、机器学习 PAI 等。
  • 了解阿里云大数据相关产品的特点、应用场景以及与其他云产品配合使用,包括表格存储(Table Store)、云数据库 RDS、分布式关系型数据库 DRDS、分析型数据库(Analytic DB)、对象存储 OSS 等,能根据实际业务场景进行基础的架构设计。
  • 掌握阿里云大数据的相关产品的基本操作,包括通过管理控制台、客户端等进行交互式操作,通过产品提供的方式(如 SQL、MapReduce、UDF、API 或 SDK 等)进行数据处理。
  • 了解各产品的最佳使用实践,能识别使用过程中常见的问题,且能给出合适的解决方案。

通用 IT 的知识:

  • 了解大数据相关的基础概念以及相关知识,如分布式存储、分布式计算、数据仓库、数据分析等。
  • 了解关系型数据库的基本概念和常用技术,包括事务、索引、OLTP、建模方法、SQL(DDL、DML)等。
  • 具备使用关系型数据库或者其他产品进行数据处理的经验。
  • 了解数据仓库的基本概念和常用技术,包括维度、事实表、即席查询、数据挖掘、OLAP、星型模型、ETL 等。
  • 具备一定的编程经验,能使用至少一种常见的编程语言如 Java、Python 等进行简单的程序开发。
  • 了解软件开发的生命周期,了解项目的建设或者项目管理。

建议的学习方法

  • 强烈推荐开通阿里云大数据相关的产品并进行实际的操作。
  • 结合阿里云官网的文档同步学习:https://help.aliyun.com/

更多学习途径

  • 参加阿里云官方提供的培训课程,可以帮助您快速的学习阿里云弹性计算相关产品的概念、使用、操作及解决方案。相关课程如下:https://edu.aliyun.com/course/1129
  • 通过阿里云的自助实验平台云中沙箱进行在线的动手实验练习https://edu.aliyun.com/lab

试卷结构

  试卷满分为 100 分,80 分为通过,考试时间为 120 分钟。


考试试卷内容

产品名称 试题占比
大数据计算服务Maxcompute 55%
数据工厂DataWorks 20%
数据集成 10%
QuickBI 5%
机器学习PAI 5%
和其他云产品配合的应用及架构 5%

考试试卷题型

题目类型 题目数据量 分值
单选题 70 题 每题1分
多选题 30题 每题1分

考试试卷内容范围

大数据计算服务考试内容

  1. 熟悉大数据计算服务基本概念,包括项目空间、表、分区、资源、任务等。
  2. 了解大数据计算服务的组成架构和组成部分功能。
  3. 掌握大数据计算服务的特点、优势及适用场景。
  4. 掌握大数据计算服务的连接和使用方式,包括使用客户端、管理控制台、Java SDK 等。
  5. 掌握大数据计算服务的数据上传和下载,可以熟练的使用
    Tunnel 命令行工具,了解 Tunnel SDK。
  6. 掌握大数据计算服务的 SQL 命令,包括 DDL、DML 以及常见内置函数。
  7. 熟悉大数据计算服务的用户自定义函数,包括 UDF、UDAF以及 UDTF,可以编写简单的自定义函数。
  8. 熟悉大数据计算服务的 MapReduce 编程框架,可以配置Eclipse 的环境,编写简单的 MR 程序。
  9. 了解大数据计算服务的 Graph 编程框架,包括基本概念、处理流程等,可以编写简单的 Graph 程序。
  10. 了解大数据计算服务 DataHub 的相关概念和使用方法。
  11. 熟悉大数据计算服务的安全和权限管理的概念和实际操作,包括用户、角色、授权(ACL&Policy)、项目空间保护、例外以及安全等级等。

数据工场 DataWorks 考试内容

  1. 熟悉 DataWorks 的基本功能模块,包括数据开发、数据管理、运维中心、组织管理以及项目管理等。
  2. 了解 DataWorks 的基本特点,包括角色隔离、环境隔离等。
  3. 可以使用项目管理和组织管理模块搭建环境。
  4. 熟练使用 DataWorks 的数据开发模块进行设计开发,包括建表、任务开发、资源上传、数据上传、新增函数等。
  5. 熟练使用 DataWorks 的数据开发模块进行工作流任务和节点任务的开发设计,并且可以配置合适的依赖和周期性调度。
  6. 熟练使用数据管理模块进行数据管理,包括血缘分析、表的使用权限申请和授权等。
  7. 对于使用过程中出现的问题,能够识别、定位,对其中基本的问题能进行修复。

数据集成考试内容

  1. 了解数据集成的基本概念和工作流程。
  2. 熟练使用数据集成进行多种场景下的数据同步,可以从不同的数据源同步数据到大数据计算服务。
  3. 了解数据集成中的 DataX 组件,包括概念、功能以及实际使用。
  4. 了解并能正确使用数据集成中的字段映射、常量使用、变量使用、导入导出规则等。
  5. 了解数据集成的最佳实践,比如切分键配置等。
  6. 能够对使用过程中出现的常见问题进行排查,并能解决其中的基本问题。
  7. 对于数据集成中的脏数据能够进行正确的处理。

Quick BI 考试内容

  1. 了解 QuickBI 的产品特点和使用场景。
  2. 掌握服务开通、数据源配置、数据分析等基本操作。
  3. 了解各种常见统计图表的适用场景和使用方法。
  4. 能够使用 Quick BI 进行仪表盘设计、报表门户设计。

机器学习 PAI 考试内容

  1. 了解机器学习的基本知识。
  2. 掌握常见的机器学习算法。
  3. 能够使用机器学习 PAI 对数据集进行数据处理和探索式统计分析。
  4. 能够使用机器学习 PAI 对数据集进行聚类、分类等数据分析。
  5. 能够使用 DataWorks 部署应用机器学习中的模型。

应用和架构考试内容

  1. 了解其他相关云产品的特点和应用场景,包括云数据库RDS、分布式关系型数据库 DRDS、表格存储(TableStore)、分析型数据库(Analytic DB)、对象存储 OSS 等。
  2. 了解大数据计算服务、数据工场 DataWorks、数据集成、QuickBI 及机器学习 PAI 等如何与其他相关产品配合使用。
  3. 能根据实际的应用场景,结合阿里云产品的特点设计合理的基础架构。

到底啦!

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码

)">
< <上一篇
下一篇>>