大数据杂谈 2013-03-25
现有的网络支付和网络交易的防欺诈系统过于复杂,也不能有效杜绝网络欺诈行为,Sift Science这样的创业公司开始尝试利用基于机器学习的大数据分析防范网络欺诈。
对于大数据分析来说, 网络安全是一个很有潜力的应用领域。 通过大数据分析, 可以对攻击者的模式进行甄别, 从而更加主动地防范网络攻击,而不是如传统的安全防御那样只能对已知的攻击模式进行防范。 而类似于 Cylance这样的初创公司, 也凭借大数据技术完成了融资。
最近, 又有一家公司, Sift Science, 利用基于机器学习的大数据分析提供防范网络欺诈的服务。 Sift Science最近得到了由风险投资基金Union Square Ventures主导的400万美金的第一轮投资。 算上此前的150万美元的种子基金, Sift Science已经总共融了550万美金。
Sift Science的服务主要面向网络交易市场, 电子支付网络以及电子商务站点, 这些也正是网络欺诈最泛滥的地方。 这些站点只需要把Sift Science的一段JavaScript整合到网页去就可以享受Sift Science的服务。
Sift Science的联合创始人 Brandon Ballinger之前在Google工作过四年,主要的工作就是防范大量的欺诈广告。Sift Science的工程师中,也有5个来自于Google,有两个来自于搜索部门,还有三个和Brandon Ballinger一起曾经在防范欺诈广告的团队工作过。
“我们意识到,在互联网上的每个站点,都会有一些‘坏’用户,也就是一些实施欺诈的用户。我们创建Sift Science的目的就是建立一套欺诈监测系统。” Brandon Ballinger说。
Brandon Ballinger在2011年6月与他大学的室友Jason Tan一起创立了Sift Science。最初,他们通过Y Combinator的2011年夏季项目进行融资。他们在与潜在的客户进行交流时,客户的最初反应是,防欺诈的系统已经有不少在做了,似乎防欺诈这个问题已经解决了。
“不过,当我们真的与客户深入交流时,我们发现,其实这个问题远没有解决。很多网站买了防欺诈系统,而几乎没有人真正去用。” Brandon Ballinger说。
他指出现有的防欺诈系统还是太过复杂:
它们不像Google Analytics或者MixPanel.那样易用。而且,为了要使用防欺诈系统,你需要走一个长长的销售流程,需要有安装费用,需要有最低付费等等。而且API过于复杂。现有的防欺诈系统采用SOAP API,这往往需要几个月的时间才能整合到现有系统中去。而Sift Science为此提供了REST API。
此外,现有系统的一个大问题就是他们采用的是固定的规则。比如说,他们对超过一定数额以上的交易,或者来自尼日利亚的交易进行过滤。然而,网络欺诈方可不是按照固定规则出牌的,他们变化一下,就可以很轻易的通过行为的改变来骗过防欺诈系统。
因此, Sift Science采用了机器学习的算法来对付网络欺诈方的这种伎俩。 Sift Science的数据库中,有超过100万中网络欺诈的行为模式,而且它还在不断的通过机器学习的算法进行添加。比如,某些URL浏览的次序,来自Tor节点的IP地址,来自深夜的交易信息等等,都有可能被添加到网络欺诈的行为模式中进行分析。
对每个用户,采用Sift Science的站点可以通过API获取用户的防欺诈分数。站点也可以通过对机器学习模型的反馈,使得防欺诈模型更加适合本站的需求。
这个系统可以用来发现网络交易中的欺诈行为,也可以帮助站点发现那些网络欺诈者创建的垃圾用户。根据Sift Science的统计,他们系统能够甄别的客户站点90% 以上的网络欺诈行为。
Sift Science的产品此前已经经过了20家客户的Beta测试,这些客户包括Airbnb,Uber以及Listia。此外还有一些顶级的电子商务站点和网络支付平台。