新書推薦:

《
赌注:海难、叛变和谋杀的故事
》
售價:NT$
352.0

《
战争与史学家:李维历史书写中的汉尼拔战争
》
售價:NT$
296.0

《
古韵新声
》
售價:NT$
8568.0

《
秦汉至唐律令立法语言论要
》
售價:NT$
347.0

《
茶叶帝国3000年
》
售價:NT$
602.0

《
机器人建模与分析的几何代数方法
》
售價:NT$
857.0

《
中国古代物质文化(修订版)
》
售價:NT$
490.0

《
社会情感学习经典入门
》
售價:NT$
357.0
|
內容簡介: |
本书全面系统地介绍了集成式机器学习的核心理论及其在现实中的实际应用。全书内容不仅详细讲解了集成式机器学习的基本概念,以及结合多个模型的预测来提升整体性能的集成方法,而且辅以丰富的实战案例和代码实现,深入探讨了它们在分类、回归、异常检测等任务中的应用效果;通过理论讲解与实际案例相结合,帮助读者深入理解集成式机器学习的关键技术,并能够将这些技术应用于实际问题中。本书每章内容都经过精心设计,既包括对基本概念的系统讲解,又涵盖了最新的研究成果和发展趋势。本书适合从事人工智能、机器学习相关研究与应用的工程技术人员阅读,也可作为人工智能等相关专业师生的参考书。
|
關於作者: |
杨小青,山西工程科技职业大学讲师,自2016年参加工作以来,担任大数据专业教研室专业教师,主讲大数据技术相关专业课程。长期从事大数据与机器学习等方面的研究,主持山西省高等学校科技创新课题“基于机器学习的加密流量识别与异常检测研究”2023L422,山西工程科技职业大学校级科技创新课题“大数据下基于机器学习的加密流量技术研究”KJ202202等项目。
|
目錄:
|
第1章 绪论 001
1.1 集成式机器学习的发展 002
1.1.1 相关理论 002
1.1.2 发展阶段 003
1.2 本书主要内容 005
第2章 基础知识与理论框架 007
2.1 大数据技术 008
2.1.1 大数据的概念与特征 008
2.1.2 大数据处理技术 008
2.1.3 大数据分析与挖掘 017
2.1.4 大数据的发展趋势 017
2.2 人工智能 018
2.2.1 人工智能的定义与发展历程 018
2.2.2 人工智能的基本原理 019
2.2.3 人工智能的应用领域 022
2.2.4 人工智能的工具与框架 022
2.3 机器学习 025
2.3.1 机器学习的定义与基本概念 025
2.3.2 机器学习算法分类 029
2.3.3 特征工程 032
2.4 理论框架 033
第3章 监督学习算法 034
3.1 线性回归 035
3.1.1 理解线性回归 035
3.1.2 损失函数 035
3.1.3 线性回归的代码示例 036
3.1.4 线性回归的应用领域及其优缺点 036
3.2 逻辑回归 037
3.2.1 理解逻辑回归 037
3.2.2 逻辑回归模型表达式 037
3.2.3 逻辑回归应用领域及其优缺点 038
3.2.4 逻辑回归的代码示例 039
3.2.5 逻辑回归与线性回归的对比 039
3.3 支持向量机 041
3.3.1 理解支持向量机 041
3.3.2 支持向量机的代码实现 042
3.3.3 支持向量机应用领域及其优缺点 043
3.3.4 支持向量回归 045
3.4 决策树 045
3.4.1 理解决策树 045
3.4.2 决策树的代码实现 046
3.4.3 决策树的优缺点及应用领域 046
3.5 随机森林 048
3.5.1 理解随机森林 048
3.5.2 随机性引入 048
3.5.3 随机森林的代码实现 049
3.5.4 随机森林的优缺点及应用领域 049
3.6 K 近邻算法 050
3.6.1 理解K 近邻 050
3.6.2 K 近邻算法的代码实现 051
3.6.3 K 近邻的优缺点及应用领域 052
第4章 无监督学习算法 054
4.1 K 均值聚类 055
4.1.1 理论背景 056
4.1.2 算法原理 056
4.1.3 数学基础 056
4.1.4 K 均值聚类的步骤 057
4.1.5 案例 057
4.1.6 K 均值聚类的优点和缺点 058
4.1.7 优化与改进 1 0 0 1 0 058
4.2 层次聚类 060
4.2.1 凝聚型层次聚类 060
4.2.2 分裂型层次聚类 061
4.3 主成分分析 062
4.3.1 理论背景 062
4.3.2 数学基础 063
4.3.3 核心思想 063
4.3.4 PCA 步骤 063
4.3.5 优点与缺点 064
4.3.6 应用场景 064
4.4 t 分布随机邻域嵌入 065
4.4.1 理论背景 066
4.4.2 数学基础 066
4.4.3 核心思想 066
4.4.4 -t SNE 步骤 067
4.4.5 优点与缺点 067
4.4.6 应用场景 067
4.5 关联规则学习 070
4.5.1 理论背景 070
4.5.2 主要概念 070
4.5.3 关键指标 071
4.5.4 常用算法 071
4.5.5 应用场景 073
第5章 深度学习算法 078
5.1 神经网络基础 079
5.1.1 神经元模型 079
5.1.2 前向传播与反向传播 081
5.1.3 损失函数与优化算法 082
5.1.4 正则化与参数初始化 084
5.1.5 深度神经网络的训练技巧 086
5.2 深度神经网络 089
5.2.1 深度神经网络的结构 089
5.2.2 激活函数的选择与作用 090
5.2.3 深度神经网络的训练技巧与调优 091
5.2.4 深度神经网络的应用 093
5.3 卷积神经网络 094
5.3.1 卷积层的基本原理 095
5.3.2 池化层的作用与类型 096
5.3.3 常见的CNN 架构 098
5.3.4 卷积神经网络的训练技巧与调优 100
5.3.5 卷积神经网络在计算机视觉中的应用案例 101
5.4 循环神经网络 102
5.4.1 循环神经网络的基本结构与工作原理 102
5.4.2 循环神经网络的训练技巧 103
5.4.3 循环神经网络在自然语言处理中的应用 104
5.4.4 循环神经网络在时间序列预测中的应用 105
5.5 长短期记忆网络 107
5.5.1 LSTM 单元的结构与功能 107
5.5.2 记忆单元与遗忘门 109
5.5.3 输入门与输出门 110
5.5.4 LSTM 在序列建模与预测中的应用 111
5.6 生成对抗网络 112
5.6.1 生成器的结构与工作原理 112
5.6.2 判别器的结构与工作原理 113
5.6.3 GAN 的对抗训练过程 115
5.6.4 GAN 的优化方法 116
5.6.5 GAN 的应用 118
第6章 强化学习算法 121
6.1 马尔可夫决策过程 122
6.1.1 核心概念 122
6.1.2 值函数 123
6.1.3 策略 124
6.1.4 解决MDP 的方法 125
6.1.5 MDP 的扩展 128
6.1.6 MDP 在强化学习中的应用 128
6.2 Q 学习 129
6.2.1 核心思想 129
6.2.2 算法步骤 129
6.2.3 贝尔曼最优方程 129
6.2.4 Q 学习的收敛性和优化 130
6.2.5 Q 学习的探索与利用 131
6.2.6 Q 学习的关键参数调优 132
6.2.7 双Q 学习 133
6.2.8 分布式Q 学习 134
6.2.9 Q 学习的应用领域 135
6.3 深度强化学习 136
6.4 策略梯度方法 138
6.4.1 策略梯度方法概述 138
6.4.2 策略表示 139
6.4.3 策略梯度算法 140
6.4.4 策略梯度方法的挑战与局限性 142
6.4.5 策略梯度方法的应用 142
第7章 集成学习算法 144
7.1 单一与集成 145
7.1.1 理解单一模型与集成模型 145
7.1.2 集成学习算法 145
7.1.3 集成学习原理 146
7.1.4 集成学习中的特征选择 147
7.1.5 集成学习中的超参数调优 147
7.2 Bagging 算法 148
7.2.1 Bagging 的基本原理 148
7.2.2 Bagging 算法详解 148
7.2.3 Bagging 算法的Python 代码实现 149
7.2.4 Bagging 算法的优缺点及应用领域 150
7.2.5 Bagging 算法的应用实例 151
7.3 Boosting 算法 153
7.3.1 Boosting 的基本原理 153
7.3.2 Boosting 算法详解 154
7.3.3 Boosting 算法的Python 代码实现 155
7.3.4 Boosting 算法的优缺点及应用领域 157
7.3.5 Boosting 算法的应用实例 159
7.4 Stacking 算法 161
7.4.1 Stacking 的基本原理 161
7.4.2 Stacking 算法详解 163
7.4.3 Stacking 算法的Python 代码实现 164
7.4.4 Stacking 算法的优缺点及应用领域 166
7.4.5 Stacking 算法的应用实例 170
7.5 元学习与学习器组合 172
7.5.1 元学习 172
7.5.2 元学习的应用 174
7.5.3 学习器组合 176
7.5.4 学习器组合的应用 176
7.5.5 元学习与学习器组合的关系 178
第8章 特征工程与模型评估 180
8.1 数据预处理 181
8.2 特征选择 182
8.2.1 特征选择的作用 182
8.2.2 特征选择的方法 183
8.3 特征提取 185
8.3.1 统计学方法 185
8.3.2 模型基础方法 186
8.3.3 模型降维方法 187
8.3.4 文本数据的特征提取 187
8.3.5 图像数据的特征提取 188
8.3.6 时间序列数据的特征提取 188
8.3.7 数值型数据的特征提取 188
8.3.8 特征提取在实际问题中的调优策略 189
8.4 特征转换 189
8.5 特征构造 190
8.6 模型评估及指标 190
8.6.1 模型评估的重要性和目的 190
8.6.2 评估指标 191
8.7 交叉验证 191
8.7.1 交叉验证简介 191
8.7.2 常见的交叉验证技术 192
8.7.3 交叉验证的实施步骤 192
8.7.4 高级交叉验证技术 192
8.8 调整模型参数 194
8.8.1 理解超参数和调优的重要性 194
8.8.2 调优的目标 194
8.8.3 常见的超参数及其影响 195
8.8.4 调优方法 195
第9章 集成式机器学习应用 199
9.1 自然语言处理 200
9.1.1 词嵌入 200
9.1.2 文本分类 202
9.1.3 情感分析 203
9.1.4 机器翻译 210
9.1.5 智能客服 214
9.2 图像处理与计算机视觉 216
9.3 生物信息学与医疗 217
9.4 通信流量与信息安全 219
9.5 金融与电子商务 222
9.6 交通与物流 222
第10章 机器学习算法实现 225
10.1 Spark 机器学习算法实现 226
10.1.1 分类 226
10.1.2 回归 229
10.1.3 协同过滤 232
10.1.4 聚类 233
10.1.5 降维 236
10.2 Flink 机器学习算法实现 237
10.2.1 环境准备 237
10.2.2 分类 238
10.2.3 聚类 243
10.2.4 评估 246
10.3 PyTorch 机器学习算法实现 247
10.3.1 线性回归 247
10.3.2 逻辑回归 248
10.3.3 多层感知器 249
10.3.4 卷积神经网络 250
10.3.5 循环神经网络 251
10.3.6 长短期记忆网络 252
10.3.7 门控循环单元 253
10.3.8 Transformer 模型 253
10.3.9 BERT 255
10.3.10 生成对抗网络 256
10.3.11 自编码器 258
10.3.12 深度Q 网络 259
10.3.13 图神经网络 262
10.4 TensorFlow 机器学习算法实现 263
10.4.1 线性回归 263
10.4.2 逻辑回归 264
10.4.3 多层感知器 265
10.4.4 卷积神经网络 267
10.4.5 循环神经网络 268
10.4.6 长短期记忆网络 269
10.4.7 门控循环单元 270
10.4.8 Transformer 模型 272
10.4.9 BERT 273
10.4.10 生成对抗网络 275
10.4.11 自编码器 278
第11章 未来发展趋势与挑战 280
11.1 自动机器学习 281
11.1.1 自动机器学习基础理论 281
11.1.2 自动化特征工程与数据预处理 282
11.1.3 AutoML 的挑战与未来发展 282
11.2 量子机器学习 283
11.2.1 量子机器学习基础理论 283
11.2.2 量子机器学习基本原理 284
11.2.3 量子机器学习的挑战与未来发展 284
11.3 新兴领域与潜在应用 285
11.3.1 集成式机器学习的新兴领域 285
11.3.2 集成式机器学习的潜在应用 285
11.4 技术发展对机器学习的影响 286
参考文献 287
|
內容試閱:
|
机器学习是人工智能和计算机科学的一个分支,专注于使用数据和算法使人工智能能够模仿人类的学习方式,并逐渐提高准确性。机器学习在数据分析和决策支持中具有重要作用,但是在面对多样性问题时有一定的局限性。随着数据量的增加和计算能力的提升,集成式机器学习在解决复杂问题和处理大规模数据方面发挥越来越重要的作用。其通过组合多个机器学习模型来提升整体预测性能和鲁棒性,被广泛应用于分类、回归、异常检测等任务。它不仅为机器学习模型的性能提升提供了一条崭新路径,还在前沿领域(如深度学习与迁移学习等)中展现出无尽的潜能。
本书全面探讨了集成式机器学习方法及其实际应用。不仅涵盖了集成式机器学习的基本理论和方法,还结合案例深入探讨了其在实际应用(如金融预测、医疗诊断、图像识别和自然语言处理、网络加密流量识别与异常检测等)的优势与挑战。通过详细的案例分析和实验结果,读者能够理解和掌握如何在实际问题中应用集成式机器学习,以及其在提高模型精度、减少过拟合和增强泛化能力方面的优势,提升模型的性能和可靠性。
本书系统阐述集成式机器学习这一重要的机器学习方法,为推动集成式机器学习理论的研究和实践提供了全面的知识体系和指导方针,能在一定程度上填补当前学术和应用领域的空白。通过本书,读者也能全面了解集成式机器学习的前沿发展和实践技巧,更好地理解其实用价值和实现步骤,激发更多创新思路,推动集成式机器学习在各行业的深入发展。同时,书中注重理论与实践的结合,既提供了深入的理论分析,又辅以丰富的实战案例和代码实现。每章内容都经过精心设计,既包括对基本概念的系统讲解,又涵盖了最新的研究成果和发展趋势。
本书内容基于横向委托研究项目——基于集成式机器学习的加密流量技术研究、山西省高等学校科技创新项目——基于机器学习的加密流量识别与异常检测研究(编号:2023L422)、山西工程科技职业大学科研基金项目科技创新项目——基于流数据算法并行化研究(编号:KJ202327),在此表示感谢!同时也感谢研究过程中合作企业的支持。
本书由杨小青、杨朋霖共同撰写,杨小青负责撰写第1、3、5、7、9、11章,杨朋霖负责撰写第2、4、6、8、10章。在本书编写过程中,对山西工程科技职业大学给予的支持与帮助表示感谢!
限于笔者水平,书中难免会有疏漏和不足之处,敬请读者给予批评指正!
山西工程科技职业大学
杨小青 杨朋霖
|
|