Anscor 2019-05-21
大数据文摘出品
一名优秀的AI算法工程师到底应该拥有什么样的背景知识?
读一个数学或者计算机学位?
资深算法工程师华校专,把他多年以来学习总结的笔记,开源了出来,书中资料非常丰富,从数学基础到统计学习应有尽有~
注:华校专曾任阿里巴巴资深算法工程师、智易科技首席算法研究员,现任腾讯高级研究员,《Python 大战机器学习》的作者。
资料地址:
http://www.huaxiaozhuan.com/
书中资料的数学部分包括线性代数基础、概率论基础以及数值计算基础。
整本书大篇幅的介绍统计学习,内容包括机器学习简介、支持向量机、朴素贝叶斯......
深度学习专题也有涉及,从深度前馈神经网络到反向传播算法再到正则化、循环神经网络、卷积神经网络都有介绍。
书中还有一些常用的小工具推荐,包括CRF、lightgbm以及Xgboost,工具介绍非常详细,从安装到使用然后再到Python接口都有文字介绍。
最后,华校专也在资料中整理了一些Python基础,包括Numpy、scipy、Pandas等常用的库和包。
数学基础
一位优秀的AI算法工程师应该有强大的数学基础,根据资料,线性代数你要会向量操作、矩阵运算以及特殊函数。概率论相关知识点,要掌握概率与分布、期望和方差、大数定律及中心极限定理、常见概率分布、先验分布与后验分布、信息论。
数值计算这门课程你要了解数值稳定性、梯度下降法、二阶导数与海森矩阵、牛顿法、拟牛顿法、约束优化。
当然,蒙特卡洛方法与 MCMC 采样也是必备的。
统计学习
除了常规的降维、聚类、半监督学习、支持向量机、朴素贝叶斯、决策树等。隐马尔可夫模型你需要知道:隐马尔可夫模型HMM、HMM 基本问题、最大熵马尔科夫模型MEMM。概率图与条件随机场也要掌握概率图模型、贝叶斯网络、马尔可夫随机场、条件随机场CRF
边际概率推断也要会精确推断和近似推断。主题模型要掌握Unigram Model、pLSA Model、LDA Model、LDA优化、sentence-LDA、模型讨论等。
统计学习这部分,是本资料篇幅最大,内容最丰富的一部分,算上机器学习简介,资料一共19个章节。
深度学习
深度学习共有9个章节,以深度学习简介开始以工程实践指导原则结束,需要掌握知识点如下所示:
工具部分
Python基础部分