大腕绿茶 2019-11-07
全文共4073字,预计学习时长8分钟
图源:Aytac Unal/Anadolu Agency/Gett
Spotify公司正在想尽一切办法,只为让用户听更多音乐。
目前,Spotify公司已经开发出各种算法,用以控制该软件的各个层面,包括主界面和“每周发现”之类的歌单。此外,他们还在致力于研发新方法来理解音乐,分析人们为什么更喜欢听某一歌曲或风格。
当Spotify的竞争对手 Apple Music、Amazon Prime Music以及Google Music都在依靠用户和社群来创建付费歌单时,Spotify与它们最大的区别就是,它可以给用户提供大量个性化定制的音乐内容和广博的的音乐知识。当然,Spotify还需要继续开发出更好的算法,因为只有这样才能为2亿多用户带来独一无二的音乐体验。并且也只有这样,这一强有力的功能才能吸引更多的用户订阅,从而进一步扩大Spotify 目前惨淡经营的业务市场。
对于应用算法来控制听歌体验这一技术,Spotify软件的主界面就是一个生动范例。在今年年初的网络大会上,Spotify研发主管Mounia Lalmas-Roelleke发表演讲称,Spotify主界面的开发目标是,帮助用户迅速找到他们可能会喜欢听的音乐。
她还解释道,Spotify的主界面由人工智能系统BaRT ( Bandits for Recommendations as Treatments )进行控制,并且该系统还能够对每一位用户的主界面进行个性化定制。界面中主要包括“书架(Shelves)”,其实也就是一排排的歌单,并且这些歌单按照一定的顺序和主题排列在书架上,其主题包括“艺术家精选集”或者“氛围营造音乐”。
BaRT系统使Spotify能够在用户听过的和全新的音乐之间做一个平衡。BaRT系统的主要目的是基于用户的播放历史,为用户推荐他们一定会喜欢的音乐。与此同时,Spotify也会顺便推送一些用户没听过的全新音乐,从避免让他们一直循环地播放几首歌曲。
BaRT系统可以归结为两个概念:利用和探索。在利用阶段,Spotify会使用已知的用户信息。例如,它会分析用户的听歌历史、曾跳过的歌曲、创建的歌单、在平台进行的社交活动,甚至用户的地理位置。然而在探索阶段,它则会探索外部世界的其它信息,比如与用户音乐品味相似,但从未听过的歌单和艺术家,或者其他艺术家的受欢迎程度等等。
此外,还有一项技术和Spotify的探索能力同样重要,那就是Spotify软件会向用户解释其推荐原因。在书架上的每一个歌单都会贴有一个标签,比如“回顾经典”或者“你可能喜欢”,这些标签能够让用户了解为什么系统推荐这些歌单。2018年Spotify对BaRT系统进行的一项研究表明,标签上的解释对于用户来说至关重要,因为他们相信这一解释。
BaRT系统的推荐成功与否,取决于用户是否真的听过书架上的音乐,以及听了多久。当用户听一首歌超过30秒,那么算法就会认定该推荐成功。对于系统推荐的歌单或者几首歌,用户听它们的时间越长,就表明推荐越成功。
对于认定用户是否喜欢一首歌,Spotify判定的界限是30秒。在2015年接受Quartz的采访时,Spotify的前产品经理马修•奥格尔(Matthew Ogle)表示,如果用户在听“每周发现”歌单中的歌曲时,还没听到30秒就跳过,那么这就意味着这首歌曲推荐失败。
Spotify公司在其研究报告中明确表示,只有记录了用户在软件上的所有活动情况后,系统算法才有可能作出成功的推荐。
对于“每周发现”歌单背后的运行机制,公司方并没有给出详细描述。在与Quartz的采访中,奥格尔对这一系统作了简要描述,并且该描述内容与Spotify员工于2015年所作的一场技术报告大致类似。“每周发现”歌单里包含30首歌,主要来自于音乐品味类似的其它用户歌单,与用户喜欢的音乐听起来很像的歌曲,以及音乐博主近期的推荐。2014年,Spotify公司为了改善其歌曲推荐机制,于是以一亿美元收购了创业公司The Echo Nest,该公司最初由布莱恩•惠特曼(Brian Whitman)与合作伙伴共同创立。惠特曼曾在2012年表示,其服务系统能够在一天之内搜索1000多万个与音乐相关的网页,从而对当前的音乐领域进行分析。
惠特曼还写道:“人们在网络上表达的每一句与音乐相关的描述性话语,无论是名词短语还是其他文本类型,都会被我们的系统搜索到。”
桑德•迪勒曼(Sander Dieleman)曾于2014年在Spotify公司实习,主要完成一些基础性工作,比如分析歌曲的听觉相似度。他曾在一篇个人博客中对音频分析算法进行解释。他写道,刚开始遇到的一个问题是,每天都有全新的音乐上传到Spotify,但是如果这个歌手之前没有什么知名度,系统也就难以推荐其歌曲。并且,如果通过协同过滤(Collaborative Filtering)或者其他基于音乐兴趣相似度的方法来推荐歌曲,这也根本没有作用,因为首先一点,人们根本不认识这些歌手。
于是,迪勒曼把这一问题称为“冷启动问题(Cold-Start Problem)”。
对于这一问题的解决办法就是分析音频本身。通过训练特殊的算法来识别音乐不同的层面,从而找出用户可能会喜欢的点。在迪勒曼进行的几次实验中,某些算法对于歌曲维度的识别极其具体,甚至能够识别出失真吉他的音效;另外一些算法则能够识别出更加抽象的维度,比如音乐类型等。
上述系统就是目前“每周发现”歌单背后非常重要的一部分。也就是通过这一系统,Spotify才能给用户推荐一些他们从未听过的歌手。
实际上,算法在Spotify上的应用无处不在。除了主界面和“每周发现”歌单里的推荐算法,其实还有一些更小的工具,用户可能用到过,但却从未意识到它们同样蕴含着先进的人工智能技术。
比如说,歌单的自动播放功能。这一技术能够分析某一歌单中的歌曲,然后对下一首歌曲的播放进行预测,这就好像歌单创建者在往歌单中不断添加新歌曲。当年,Spotify为了找到新方法来实现这一功能,于是发布了一个“百万歌单数据库”,里面主要包含Spotify用户创建的歌单。通过应用该数据库,能够对大众喜欢的音乐作品进行特点分析。
在2018年的行业大会上,Spotify公司也邀请了其他人工智能专家来共同解决这一问题。根据会议组织人员的分析,当时围绕这一项目,共有100多个学术和行业团队参与竞争。但是,Spotify是否采纳了当年胜出团队的想法,我们不得而知。
除此之外,Spotify的研究团队还在对翻唱歌曲的检测方法进行研究,让Spotify能对其进行识别并播放,使用户听到歌曲的翻唱范本,而不是原本想听的原唱版本。为了达到这一目的,Spotify必须能够把原版和翻唱准确区分开来,尤其是乐器演奏和现场表演。事实证明,爵士乐的识别尤其困难,因为爵士乐大多是即兴表演。
除了识别翻唱,Spotify研究人员也在研究如何匹配歌词文本与每句歌词演唱时间。该技术不仅能够有效帮助Spotify上的“音乐背后(Behind the Music)”功能,从而让歌词和音乐同步展现,而且也能为Spotify带来新的发展机遇。
今年年初Spotify的电脑科学家就表示,“即时歌词的应用还能丰富用户其他的音乐体验,比如卡拉OK、歌曲文本检索、以及曲内导航等各种应用”。
除了上述所有对于Spotify平台本身的研究之外,Spotify公司还在对其用户进行研究。2019年4月发表的一项研究显示,Spotify分析了1600多万名用户的数据,并记录了他们2016年12月至2018年2月之间的所有听歌模式,包括每天播放某一歌手或者某首歌多少次,居住于美国哪个州等。
通过分析以上数据,以及用户提供的性别和年龄信息,Spotify就能够研究居住地址的改变是否会影响听歌品味,以及年龄的增长是否会影响风格的选择。
对于用户是否已搬到另一个州居住,Spotify研究团队通过以下这种巧妙的方式进行判定:根据用户的地理位置数据,系统将2016年圣诞节、2017年感恩节和2018年圣诞节这三个节假日中的两个假日期间,前往另一个州的用户判定为已经从他们常用登录州搬离。
在分析各个州用户的音乐品味,并对比他们搬迁的总体趋势之后,Spotify研究团队得出了一个结论,即长远来看,地理位置确实会对一个人的音乐品味产生影响,但影响程度不大。
Spotify 的研究人员还写到,“地理位置的改变的确会略微影响个体的音乐品味,使其适应当地新环境。但其影响程度非常小,相比于目前的新环境,用户的音乐偏好仍然会更加接近于以前。”
此外通过研究用户年龄,他们还发现,10到20岁用户常听的音乐将成为未来的流行趋势,因为这些音乐已经塑造了他们的“音乐个性”。
以上分析表明,Spotify各种技术的实现都需要使用海量数据。因此为了提高市场竞争力,Spotify必须继续收集用户数据以维持其服务。2015年针对“每周发现”歌单的一项研究报告显示,Spotify每天会记录约一万亿字节的用户数据。
但是,所有收集的数据只会应用于用户服务本身。此外,Spotify公司也在其研究报告中明确表示过,只有记录了用户在软件上的所有活动情况后,系统算法才有可能做出成功的推荐。
或许,这就是能让一个音乐软件成功的秘诀。毕竟Spotify在各大音乐巨头公司的夹击下,仍能发展壮大:它每年在全球范围内订阅用户的数量比Apple Music高出5000万之多。
通过运用一系列强大的算法来分析音乐和个人数据,Spotify或将影响整个音乐体验。
留言 点赞 关注
我们一起分享AI学习与发展的干货
如需转载,请后台留言,遵守转载规范
一个客户要求给网站添加一个背景音乐,我用的是html5添加网页背景音乐的代码,在此记录一下以后有用。html5方法二:<videocontrols=""autoplay=""name="media&q