双十一、不如买一本书吧

admin • 2021-11-12 20:30 • 人工智能

我的第一本书出版了：《人工智能数学基础与Python机器学习实战》。

内容简介

通常来说，人工智能（Artificial Intelligence，AI）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能的研究领域包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

机器学习就是用算法解析数据，不断学习，对世界中发生的事做出判断和预测的一项技术。生活中很多机器学习的书籍只注重算法理论方法，并没有注重算法的落地。本书是初学者非常期待的入门书，书中有很多的示例可以帮助初学者快速上手。

本书包括3个部分：

第1部分介绍基本的数学工具和机器学习的概念；
第2部分系统深入地讲解现今已成熟的机器学习方法和技术；
第3部分介绍了SparkSpark机器学习

本书适合各类读者阅读，包括相关专业的大学生或研究生，以及不具有机器学习或统计背景、但是想要快速补充深度学习知识，以便在实际产品或平台中应用的软件工程师。

本书特色

有些读者在学习时会有这样一种感觉：一门课学完了、考试过了，却不知道学了有什么用，尤其是数学类的课程。这是因为传统教材大多数是按照“定义—例题—计算”的步骤来大篇幅罗列数学概念，偏重理论定义和运算技巧，不注重梳理学科内在的逻辑脉络，更没能深刻挖掘出本学科与当下前沿技术的交汇点。因此，本书采用了很多的案例和代码，不局限于算法本身，更注重于实践方面。

本书具有以下特点：。

脉络清晰：数学基础、算法详解和持续探索。
系统全面：网罗监督学习回归、监督学习分类、无监督学习、半监督学习等机器学习算法。
注重实战：使用Python进行机器学习的项目实战，使用sklearn实现算法模型的搭建。
紧跟发展：不局限于Python中的sklearn的学习，还紧跟大数据时代的发展。
知识范围广：本书的知识广度比较大，涉及了高等数学、线性代数、概率论、数据处理和机器学习算法等方面。

具体大纲

下面是本书的具体具体大纲

第一章：走进机器学习的世界

1.1 机器学习概述
- 1.1.1 什么是机器学习
- 1.1.2 机器学习的分类
1.2 Python编程语言
- 1.2.1 Python环境搭建
- 1.2.2 机器学习相关软件包介绍
1.3 机器学习的数学知识
- 1.3.1 导数
- 1.3.2 基本函数的求导公式
- 1.3.3 求导法则
- 1.3.4 Python实现求导
- 1.3.5 泰勒展开式
- 1.3.6 微积分基本定理
- 1.3.7 基本函数的积分公式
- 1.3.8 Python实现积分

第二章：人工智能数学基础

2.1 线性代数
- 2.1.1 向量及其线性运算
- 2.1.2 矩阵及其线性运算
2.2 随机变量
- 2.2.1 离散型随机变量
- 2.2.2 连续型随机变量
2.3 随机变量概率分布
- 2.3.1 伯努利分布
- 2.3.2 泊松分布
- 2.3.3 指数分布
- 2.3.4 二项分布
- 2.3.5 正态分布
- 2.3.6 伽马分布
- 2.3.7 贝塔分布
- 2.3.8 卡方分布
- 2.3.9 t分布
- 2.3.10 F分布

第三章：数据获取和预处理

3.1 数据获取
- 3.1.1 自带和下载数据集
- 3.1.2 创建数据集
- 3.1.3数据集
3.2 标准化
- 3.2.1 z-score标准化
- 3.2.2 Min-max标准化
3.3二值化
- 3.3.1 特征二值化
- 3.3.2 标签二值化
3.4 特征处理
- 3.4.1 独热编码
- 3.4.2 多项式特征
- 3.4.3 PCA降维
3.5 数据消洗
- 3.5.1 Pandas数据消洗
- 3.5.2 sklearn处理缺失值
3.6 文本特征提取
- 3.6.1 字典提取器
- 3.6.2 词袋模型
- 3.6.3 权重向量
3.7 图像特征提取
- 3.7.1 提取像素矩阵
- 3.7.2 提取角点
- 3.7.3 提取轮廓
- 3.7.4 提取局部特征点
3.8 特征选择
- 3.8.1 Filter过滤去
- 3.8.2 Wrapper包装法
- 3.8.3 Embedded嵌入法

第4章：线性回归和逻辑回归

4.1 线性回归
- 4.1.1 最小二乘法
- 4.1.2 梯度下降法
- 4.1.3 线性回归实现
- 4.1.4 Lasso回归和岭回归
- 4.1.5 回归模型评估
- 4.1.6 多项式回归
4.2 逻辑回归
- 4.2.1 逻辑回归算法
- 4.2.2 逻辑回归实现
- 4.2.3 分类模型评估

第5章 KNN和贝叶斯分类算法

5.1 KNN算法
- 5.1.1 KNN算法的距离度量
- 5.1.2 KNN算法的代码实现
- 5.1.3 交叉验证
- 5.1.4 KD树
5.2 贝叶斯分类算法
- 5.2.1 贝叶斯定理
- 5.2.2 高斯朴素贝叶斯
- 5.2.3 多项式朴素贝叶斯
- 5.2.4 伯努利朴素贝叶斯

第6章决策树和随机森林

6.1 决策树
- 6.1.1 熵
- 6.1.2 决策树算法
- 6.1.3 剪枝算法
6.2 决策树代码实现
- 6.2.1 可视化决策树
- 6.2.2 分类树
- 6.2.3 回归树
6.3 随机森林
- 6.3.1 集成学习算法
- 6.3.2 随机森林分类
- 6.3.3 随机森林回归

第7章支持向量机

7.1 SVM核心概念
- 7.1.1 线性可分
- 7.1.2 核函数
- 7.1.3 剪枝算法
7.2 SVM代码实现
- 7.2.1 SVC
- 7.2.2 SVM人脸识别
- 7.2.3 SVR

第8章聚类算法

8.1 K-means聚类算法
- 8.1.1 K- means聚类算法原理
- 8.1.2 模型评估
- 8.1.3 图像处理
- 8.1.4 K-means聚类算法实例
8.2 层次聚类算法
- 8.2.1 层次聚类算法原理
- 8.2.2 层次聚类算法实例
8.3 密度聚类算法
- 8.3.1 密度聚类算法原理
- 8.3.2 密度聚类算法实例

第9章 EM和HMM聚类算法

9.1 EM聚类算法
- 9.1.1 最大似然估计
- 9.1.2 詹森不等式
- 9.1.3 EM算法原理
9.2 EM算法代码实现
9.3 HMM聚类算法
- 9.3.1 马尔可夫过程
- 9.3.2 隐马尔可夫模型

第10章主题模型

10.1 LDA主题模型
- 10.1.1 Dirichlet分布
- 10.1.2 LDA贝叶斯模型
10.2 自然语言处理常用工具包
- 10.2.1 NLTK
- 10.2.2 spacy
- 10.2.3 Gensim
- 10.2.4 jieba
- 10.2.5 Stanford nlp
- 10.2.6 Fuzzywuzzy
- 10.2.7 Hanlp
10.3 LDA主题模型实例

第11章推荐算法

11.1关联规则
- 11.1.1 置信度
- 11.1.2 支持度
- 11.1.3 提升度
- 11.1.4 代码实现
11.2 基于用户行为的推荐算法
- 11.2.1 矩阵分解
- 11.2.2 SVD代码实现
11.3 基于评分的推荐算法
- 11.3.1 Slope One算法
- 11.3.2 Slopeonef代码实现
11.4 协同过滤

第12章数据建模

12.1 监督学习
- 12.1.1 监督学习回归
- 12.1.2 监督学习分类
12.2 半监督学习
- 12.2.1 标签传播算法
- 12.2.2 半监督学习分类
11.3 保存模型
- 12.3.1 pickle
- 12.3.2 joblib
- 12.3.3 sklearn2pmml
第12章数据建模
12.1 监督学习
- 12.1.1 监督学习回归
- 12.1.2 监督学习分类
12.2 半监督学习
- 12.2.1 标签传播算法
- 12.2.2 半监督学习分类
12.3 保存模型
- 12.3.1 pickle
- 12.3.2 joblib
- 12.3.3 sklearn2pmml

第13章 Spark机器学习

13.1 Spak分布式集群搭建
- 13.1.1 创建Centos7虚拟机
- 13.1.2 设置静态ip
- 13.1.3 配置SSH服务
- 13.1.4 安装Java
- 13.1.5 搭建三台Centos7主机
- 13.1.6 修改hosts文件
- 13.1.7 配置SSH免密码登录
- 13.1.8 搭建Hadoop集群
- 13.1.9 搭建Zookeeper集群
- 13.1.10 启动Hadoop和Zookeeper集群
- 13.1.11 搭建Spark集群
13.2 Hadoop和Spark的基础知识
- 13.2.1 HDFS
- 13.2.2 Spark Shell
- 13.2.3 RDD编程
- 13.2.4 Spark SQL
13.3 Spark mllib
- 13.3.1 回归模型
- 13.3.2 分类模型

笔者感触

笔者：刘润森，熟悉PyTorch、TensorFlow等深度学习框架，对计算机视觉、机器学习和深度学习有深入研究

笔者最早从大一下学期开始接续学习机器学习，也曾在 CSDN 中分享一些相关机器学习的教程和其他IT领域的学习笔记，因此有出版社的朋友找到笔者，希望可以将这些内容整理成书，于是就有
了这本书。

对笔者而言，本书也是对自己学习成果的总结。大家千万不要认为学习机器学习就是调包，而忽视了里面数学的美，也不要过于在意里面的复杂算法。就国内而言，除少数公司的少数机器学习部门是推公式、做理论优化外，大部分机器学习岗位都是在用成熟的工具做开发、搞特征、调模型、上线产品。

例如，阿里云机器学习PAI平台，封装了上百种算法，提供了完整的机器学习链路，重点是具有可视化操作界面，通过拖曳操作，进行少量配置，即可完成业务处理。这里提醒一句，数学对于机器学习来说也是非常重要的。同时，数据分析也很重要，这里包括对数据的理解、对统计学的认知等，可以说，一个好的机器学习算法工程师也一定是一个好的数据分析师。

购买链接

下面是这本书在京东上的购买链接，淘宝天猫等购物平台均有销售，喜欢就看看，不喜欢静静走开即可。

京东自营购买链接

当当自营购买链接

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

人工智能数据挖掘机器学习

二维码

深度学习笔记_搭建一个简单网络(完整版)_手写数字识别MNIST

< <上一篇

人体姿态检测通过Opencv+Openpose实现

下一篇>>

搜索内容