来源:AI有道
本文共1398字,建议阅读5分钟。
本文为你详细先容AI资源——《AI 算法工程师手册》,涵盖了机器学习、深度学习等领域的很多主要理论知识和实战履历。
最近作者在浏览网页的时候,有时创造一份非常不错的 AI 资源,便是这本《AI 算法工程师手册》 。本文将给大家推举这本精良教材,并作详细的先容。
这本《AI 算法工程师手册》已正式开源,无需购买纸质书本,可以直接在线阅读,体验感爆棚。在线阅读地址为:
http://www.huaxiaozhuan.com/
作者简介
首先不得不提一下本书的作者,作者华校专,曾经在阿里巴巴担当资深算法工程师,现任智易科技首席算法研究员。他还是《Python 大战机器学习》书本的作者。
书本先容
这本《AI 算法工程师手册》是作者多年以来学习总结的条记,经整理之后开源于世。关于为什么将完全书本开源,作者是这样说的:曾有出版社约稿,但是考虑到出版韶光周期较长,而且书本购买本钱高不利于技能广泛传播,因此就采纳开源的形式。
既然本书是 AI 算法工程师的手册,因此内容非常丰富,基本涵盖了机器学习、深度学习等领域的很多主要理论知识和实战履历,同时也先容了工程运用中常常利用的 AI 工具和编程库。
书本整体包含了 5 大块内容,分别是:
数学根本统计学习深度学习自然措辞处理工具下面我们分别来看一下各模块的内容。
1. 数学根本
提升 AI 内功心法离不开踏实的数学根本。本书数学根本这部分,作者紧张先容了最主要的 4 点:
线性代数根本 概率论根本数值打算根本 蒙特卡洛方法与 MCMC 采样例如线性代数部分最基本的根本知识:
2. 统计学习
这部分内容作者花了比较大的篇幅,紧张先容的是机器学习中一些常见的算法,包括线性回归、感知机、支持向量机、决策树、集成学习等。同时还包括模型评估、特色选择、降维等。详细内容如下:
机器学习简介 线性代数根本 支持向量机 朴素贝叶斯决策树knn 集成学习 梯度提升树特色工程 模型评估降维 聚类 半监督学习 EM算法 最大熵算法隐马尔可夫模型概率图与条件随机场边际概率推断每个算法的理论先容非常详细、数学推导完全,例如支持向量机中关于对偶问题的推导:
3. 深度学习
这部分紧张先容深度学习神经网络的基本知识和模型,包括前馈神经网络、卷积神经网络、循环神经网络等。详细内容如下:
深度学习简介反向传播算法正则化最优化根本卷积神经网络循环神经网络工程实践辅导原则这部分详细先容了神经网络模型的基本构造和演习方法,例如列举了经典 CNN 构造:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 变种、SENet、DenseNet。
1998 年 LeCun 推出的 LeNet 网络
4. 自然措辞处理
这部分作者紧张先容了自然措辞处理领域的 2 个方面:
主题模型
Unigram Model pLSA Model LDA Model 型谈论词向量
向量空间模型 VSM LSA Word2Vec GloVe5. 工具
这部分紧张先容了 AI 常用工具和函数库,详细内容如下:
CRFlightgbmxgboostscikit-learnsparknumpyscipymatplotlibpandas这部分的内容更加侧重于 AI 实战,包含很多详细函数库的利用教程和代码。例如 lightbgm 是一个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。本书对 lightbgm 的安装、各参数含义、调参、利用等都作了详细的先容,宛如一份精良的中文文档!
这里附上 lightbgm 大略的 pip 安装方法:
pip install lightgbmpip install --no-binary :all: lightgbm #从源码编译安装pip install lightgbm --install-option=--mpi #从源码编译安装 MPI 版本pip install lightgbm --install-option=--gpu #从源码编译安装 GPU 版本pip install lightgbm --install-option=--gpu --install-option=\公众--opencl-include-dir=/usr/local/cuda/include/\"大众 --install-option=\"大众--opencl-library=/usr/local/cuda/lib64/libOpenCL.so\"大众 #从源码编译安装,指定配置#可选的配置有:# boost-root# boost-dir# boost-include-dir# boost-librarydir# opencl-include-dir# opencl-library
同样,像 xgboost、scikit-learn 等库,书中也作了详尽的阐明。除此之外,还有 spark 的内容哦,可以说是非常全面了。
末了
不得不说,这本《AI 算法工程师手册》是一本比较完备的 AI 书本,既包含了算法理论,也有实战 AI 算法库的利用。作为一份参考手册还是非常不错的!
更主要的是本书完备开源,直接在线阅读就好了。不过把稳该书本仅供个人学习利用,非作者赞许不得运用于商业领域。
编辑:文婧
校正:林亦霖
— 完 —
关注清华-青岛数据科学研究院官方微信公众年夜众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。