为什么将全部系统迁上公有云?流利说是这样做出选择的

梦见唐朝的故事 2019-05-07

凭借其稳定可靠的技术、全面的安全管理功能和丰富的生态系统,AWS让我们能够专注于核心业务,实现快速的产品发布和迭代,并为我们的客户提供稳定、可靠和个性化的在线学习服务。——流利说联合创始人兼首席技术官胡哲人

流利说是一家人工智能驱动的教育科技公司,主打“人工智能 + 教育”的概念。流利说由国家“千人计划”特聘专家王翌、胡哲人和林晖博士于2012年9月共同创立,公司拥有一支优秀的人工智能团队,该团队自主开发了人工智能英语老师,基于深度学习为每一位用户提供个性化、自适应的课程,从而大大提高学习效率。

经过多年积累,流利说建立了大型“中国人英语语音数据库”,在此基础上开发了领先的英语口语评测、英语写作打分引擎和深度自适应学习系统,从听、说、读、写等维度全面提升用户的英语水平,为用户提供全面系统的英语学习解决方案。

截至2018年7月,公司的旗舰应用程序“英语流利说”注册用户超过7000万,其中付费用户超过100万,覆盖全球175个国家/地区,包括中国的379个城市。“英语流利说”是国内广受欢迎的英语学习应用程序和活跃的语言学习社区,被苹果公司评为“App Store精华”和“年度精选应用程序”。

流利说是国内最早实现可观盈利的在线教育公司之一。2017年7月,流利说完成了近亿美元的C轮融资。经过几轮投资,流利说获得了IDG、挚信资本、GGV、华人文化产业投资基金 (CMC)、心元资本、双湖资本和赫斯特资本等知名风投公司的投资。

业务突飞猛进带来的挑战

早期,流利说采用本地部署与公有云平台相结合的方式,在2013年2月14日推出了第一款产品,即“英语流利说”应用程序。该产品集成了语音识别、打分引擎和自适应学习等多种核心技术,不仅具有情景对话、配音秀、发音课程和其他丰富的内容,还可以提供人工智能英语老师和游戏化的学习,例如角色扮演、打分和闯关等,为用户带来充满乐趣的体验。这款有趣又有效的产品很快获得了用户的认可,用户数当年就突破了百万,随后很快实现了从百万到千万的跨越。

随着业务的快速发展,流利说的现有IT框架开始面临新的挑战。首先,突飞猛进的发展使得数据流量呈指数增长。而且,每天不同时段流量变化很大,高峰时段的流量比非高峰时段高4到5倍,这就需要IT架构能够提供足够的可扩展性。

第二,业务迅速发展,产品组合和功能越来越多,使得复杂度不断增加。特别是在2016年开始商业化运营之后,付费用户数量猛增,对访问性能和稳定性提出了更高的要求。

第三,大数据分析给系统性能和容量带来了挑战。随着业务的发展,流利说的“中国人英语语音数据库”容量不断增长,系统每天需要处理的用户行为分析和反馈也日益复杂。在这种情况下,如何快速合理地分配资源和提高分析效率对于公司来说至关重要。

胡哲人表示,“应对这些挑战的关键是要选择一个稳定、安全并且功能强大的云平台。基于之前对AWS的了解,我们在2014年决定将整个现有系统迁移到AWS。事实证明我们的选择是正确的。”

选择AWS的重要考量因素

流利说的旗舰 App“英语流利说”基于大数据和人工智能构建,是一款面向成人的英语学习产品。安全性、稳定性和可扩展性是流利说在选择云平台时重点考虑的因素。AWS凭借稳定可靠的技术、全面的安全管理功能和丰富的生态系统,成为流利说的最终选择。

稳定可靠的技术

AWS的稳定性和可靠性是由其各种功能产品的稳定性和整体技术架构决定的。流利说使用的AWS产品主要涉及计算、存储和数据分析功能。在计算方面,AWS提供了一系列可以相互配合的功能,包括Amazon EC2、Amazon ECR、AWS Lambda、AWS Auto Scaling和Elastic Load Balancing。这些功能相互配合,不仅可以提供大小可调的计算容量,让用户能够控制需要的计算机资源并根据计算需求的变化扩展或缩减计算容量,还可以自动检测运行状况不佳的实例并将流量重新路由到运行状况良好的实例,直到运行状况不佳的实例恢复正常运行。这样可以提高应用程序的容错能力。在存储方面,Amazon S3以冗余方式将数据存储在多个设施和一个设施中的多个设备上,从而为用户提供 99.999999999% 的数据持久性。另外,Amazon Glacier和AWS Storage Gateway让用户不仅能够安全、无缝地将本地存储与AWS存储集成,还能够以更低的成本安全可靠地存储海量数据。

胡哲人指出,“AWS全方位的稳定性让我们的开发团队能够专注于产品研发,不必担心基础架构会出现任何问题。”

全面的安全管理功能

流利说拥有庞大的“中国人英语语音数据库”,这是它的核心资产。随着数据量不断增长,AWS的安全数据管理的重要性日益凸显。随着业务快速发展,以及产品组合不断增多,流利说需要在优化资源的同时进行集群隔离和划分不同业务。

胡哲人说道,“Amazon VPC、AWS Identity and Access Management(IAM)和其他安全管理功能为我们提供了多种便捷的方式来实现安全管理目标。”。

Amazon VPC让用户能够在AWS中预先配置多个虚拟网络环境,并将不同的业务置于不同的虚拟网络中。例如,借助Amazon VPC,可以在前端为用户访问的应用程序系统创建公有子网,而将数据库和应用程序服务器等后端系统置于不能访问Internet的私有子网中,并且利用IAM来创建和管理AWS用户和组,以便通过安全组和访问控制列表等多个安全层来实现对整个系统的安全管控。

丰富的生态系统

胡哲人强调,“作为一家初创公司,流利说必须专注于核心业务。所以,如果有开源工具可以满足我们的需求,那么我们肯定首选开源工具。不管是开源产品还是闭源产品,一涉及到与公有云平台集成,自然就会选择AWS,无论我们身在何处。丰富的生态系统让我们能够根据具体需求轻松选择应用程序系统,降低人工成本。例如,我们使用开源工具Terraform来管理资源,而它支持的云平台就包括AWS。”除了技术丰富的生态系统之外,AWS还提供各种线上和线下培训以及用户和开发人员活动,将全球顶尖的开发人员和行业用户聚集在一起,让他们有机会分享自己的成功经验。

轻松应对用户激增,成本大幅降低

2014年9月,流利说将整个系统迁移到AWS,包括流利说的官方网站、数据分析平台、支付流程和业务应用程序等系统,并在整个过程中保持安全稳定的运行。目前,流利说使用的AWS服务包括 Amazon EC2、Amazon S3、Amazon RDS、Amazon ElastiCache、AWS Support、Amazon Elastic Block Store、Amazon CloudWatch、AWS Data Transfer、Amazon EMR、Amazon DynamoDB、AWS Config、AWS Storage Gateway、Amazon Route 53、AWS CloudTrail、Amazon Simple Queue Service和Amazon Simple Notification Service。如图显示了流利说基于AWS的系统架构。

为什么将全部系统迁上公有云?流利说是这样做出选择的

部署AWS为流利说带来了两方面好处:

第一,系统的整体稳定性显著提高,应用程序的可用性达到99.9%。流利说的业务发展有两个特点:用户数快速增长:用户数在4年间就从100万增长到7000万;每天24小时用户流量分布不均匀:在中午和下午6点后的高峰时段,用户流量激增,是非高峰时段的10倍。AWS的自动运维功能让流利说的整个系统能够轻松应对流量的变化,从而为用户提供稳定可靠的访问服务和更好的用户体验。

第二,节省了资源成本和人力成本。在资源分配方面,AWS Auto Scaling和Amazon EC2 Spot实例等AWS提供的功能使得资源占用成本大幅降低。特别是部署Amazon EMR之后,数据处理速度和处理量大幅提高,而在夜间采用低成本的实例来处理数据也有效地降低了成本。在人工成本方面,AWS的自动管理功能降低了对系统运维的需求,节省了雇用专职运维人员的成本。

为了发展成为一家更好的人工智能驱动的教育科技公司,流利说计划在未来采用更多AWS产品(包括Amazon Machine Learning和GPU实例集群)来提高数据分析速度,加快模型训练迭代,为用户提供更好的个性化学习体验。

相关推荐