ivgwt 2019-02-07
Google现在通过其机器学习框架TensorFlow,整合现有的机器学习模型和rules-based的保护机制,提升垃圾邮件检查能力,每天多删除了1亿条垃圾邮件。
Google近日公开Gmail如何通过其机器学习框架TensorFlow,提升垃圾邮件检查能力,每天多删除了1亿条垃圾邮件的成果,尽管Google现有的机器学习模型,加上其他保护服务,能够阻挡Gmail收件箱中99.9%以上的垃圾邮件、钓鱼邮件,或是恶意软件,Google还在持续改善机器学习模型,提升安全防护,因此,Gmail最近借助ML框架TensorFlow,整合现有的机器学习模型和rules-based的保护机制,成功地找出少于0.1%的遗漏垃圾邮件。
Google表示,Gmail每个月有15亿名用户使用,其中有500万人是G Suite的企业用户,不管是对消费者或是企业来说,Gmail很大的卖点即是内建的安全保护机制,好的安全管理意味着持续领先于威胁,而Google是从哪发现这些额外的1亿条垃圾邮件?
Google指出,过去一些难以检查的垃圾邮件种类,现在通过TensorFlow的协助,能够找出这些隐藏垃圾信息的邮件,如以图像为主的邮件、隐藏嵌入内容的邮件,或是来自新创建domain的邮件等。
Google指出,机器学习技术可以从大量的垃圾邮件数据中,抓出人无法察觉的特征,也能够快速地应对不断推陈出新的垃圾邮件,通过机器学习,能够使Google根据多种不同因素,做出更细化的决策,每封邮件都含有上千个潜在的信号,只出现一些特征符合常见的垃圾邮件特征,并不代表该邮件就是垃圾邮件,而机器学习则是让Google能够综合评估每一个特征,再做出决定,最后,机器学习方法还能帮助Google打造个性化的垃圾邮件保护,每个人对邮件的看法不同,有些邮件会被认为是垃圾邮件,也可能被认定为重要邮件,如新闻订阅邮件,或是应用程序的邮件通知。
借助机器学习框架TensorFlow,Google可以不断ML优化模型,并且可以花更少心力于ML框架,聚焦在检查垃圾邮件的工作上, 由于大规模部署机器学习模型是一项复杂且耗时的工作,TensorFlow框架提供多种工具,让机器学习执行的过程更加简单且有效率,举例来说,TensorBoard能够让开发者全面地监督模型训练流程,以及快速评估新模型的性能,也因为通过TensorFlow框架,Google能够一次训练和测试多个不同的ML模型,使开发最佳模型的工作变得更加有效率。