bensonrachel 2018-04-11
介绍
斯坦福大学长期以来一直被认为是教学、教师素质和教学内容方面最好的大学之一。随着最近机器学习领域的热潮,斯坦福的ML课程引起了很多兴趣(您可以在YouTube上找到视频)。
为项目学生提供了两种选择。既可以选择自己的主题(称为“自定义项目”),也可以参加“默认项目”,该项目基于斯坦福问题答案数据集(SQUAD挑战)构建问答模型。“ 斯坦福问题答案数据集(SQUAD)是一个新的阅读理解数据集,由众多维基百科文章中的众包工作者提出的问题组成,其中每个问题的答案都是相应阅读段落的一段文字或跨度。”在AVBytes上还报道过这个问题,阿里巴巴和微软的模型在这个数据集上得分最高。
一些提交的论文无疑会给你留下深刻的印象。“自定义项目”的获胜者在语音合成方面做了一个项目,在该项目中,文本到语音合成模型从一系列输入字符中产生音频。他们还演示了如何构建一个卷积序列,以低于75美元的价格从头开始以自然语音和发音进行排序模型!
有一个关于爱斯基摩语的机器翻译的项目也获得了奖项。学生们建立了一个序列来对神经机器翻译模型进行排序,将爱斯基摩语翻译成英文。
另一个引人注目的项目是“自然语言生成SQL查询”。学生们从自然语言问题开发了一个用于生成SQL查询的模型。
甚至还有一个关于创造模因的项目 - Dank Learning:使用深度神经网络生成模因。
看看斯坦福大学的页面在这里列出的每个项目。 http://web.stanford.edu/class/cs224n/reports.html
斯坦福大学向社区开放了这些项目,所有有抱负的数据科学家和从业人员都可以阅读所采用的不同(有时是独特的)方法。这里强烈建议阅读这份清单并选择您感兴趣的论文。这对于NLP领域的你来说是一个很好的学习机会。
这无疑会引起数据科学家的兴趣,它基于从自然语言生成SQL查询。快去一探究竟!
哪个项目引起了你的注意?可以在下面的评论部分一起讨论。