旭峰 2019-01-27
【新智元导读】人工智能教学网站fast.ai最近更新了新版本的针对开发者的深度学习实践课程,将原来的14课时缩短到7课时,比较适合经常加班做开发的程序员。本文给大家梳理了一下课程概览。
fast.ai最近刚刚发布了《Practical Deep Learning for Coders》第三次迭代版本。
新智元编辑看过以后,觉得有必要向还在苦恼如何入手机器学习的同学们,推荐一下这个新课程。
你从未体验过的船新版本:本版本号称是全新教材,全新实战案例。
共有7个课时,区别于之前的14课时,但内容质量并没有降低。每节课2个小时,加上课后复习的时间,基本上一节课能够让你饱饱满满充充实实的学够10个小时。
整合云平台:贴心的提供了Google Cloud和Microsoft Azune的云GPU平台,以及Crestle和Gradient等平台的整合方案,方便大家进行练习。
预备基础:学习只需要有至少一年的codign经验,最好是Python。有
高中数学基础就行,有些课程可能好需要用到高等数学。
唯一需要做的是提前对Jupyter Notebook环境有一定了解。
学习曲线:自上而下的教学理念,通过实际问题入手,然后逐步深入理念。符合程序员的学习路径。
框架:fast.ai使用Pytorch作用教学工具。但是这种东西属于一通百通,基本上你一旦掌握了套路,接下来用TensorFlow/Keras、CNTX、MXNet或者其他深度学习库都不成大问题。
第一课主题是图片分类。从训练一个宠物种类图片识别分类器,使之达到SOTA精度级别。
迁移学习是本课程的关键,同时可以了解如何分析模型,以及它的失败模式。
需要注意的是,课程练习需要用到FastAI库,最好找已安装了的云GPU供应商。
fast.ai推荐使用PaperSpace,GPU租用价格大概是1小时3元,注册流程非常简单,支付方式使用信用卡即可。
当然如果你愿意折腾,并且手里有一点先前,也可以自己搭建一台计算机,反正1G显存的GTX 650是跑不起来代码的。
第二课主题是数据清洗和生产。主要是教大家用自己的数据,创建一个“从灰熊中找出泰迪熊”的分类模型,学会如何生成teddy-finder,然后可以在线上访问。
课程后半部分,会教大家如何从零开始训练一个简单的模型,生成我们自己的梯度消失循环。
第三课主要讲到数据块、多标签分类和图像分割。会用到2个数据集:Planet数据集和CamVid数据集。
Planet数据集是一个多标签数据集,可以让大家同时学习多标签数据集。
fast.ai声称他们的终极CamVid模型比市面上所有教学用的模型,更靠谱。
第四课讲表格数据;协同过滤;嵌入。本节课主要是NLP相关,使用电影评分网站IMDB提供的影评数据集。
本节课的内容是预测一个影评是正面还是负面。我们知道,有时候评价里的用词,可能和原意相反。比如使用证明词语,表达的却是负面意思。
学习路径无非就是先要么创建一个语言模型自行训练,或者下载一个已经训练好的模型,然后调参,然后移除encoder。
本节课前半部分内容涉及CV、NLP、表格、协同过滤,后半部分还会涉及到激活函数、指针、层以及损失函数。
第五课会讲到反向传播;加速随机梯度下降;从零搭建神经网络。
第六课讲正则化;卷积; 数据伦理。包括Dropout、Data augmentation、批量标准化。
第七课讲从零开始构建Resnets;U-net;生成网络以及GAN。
好了,介绍就到此为止了。如果你发现有更好的课程,请留言告知。关于PaperSpace我先更多说两句。
如果你发现国内有更好的替代方案,欢迎告知我们。因为毕竟国外的产品,在访问速度和稳定性上还是不好保证。而且没有中文的使用教程,不是很方便。