数据“成精”究竟有多可怕?网络怎么知道我快秃了?

架构师之路 2019-11-22

全文共3108字,预计学习时长9分钟

数据“成精”究竟有多可怕?网络怎么知道我快秃了?

图: Franki Chamaki/Unsplash

我们的数据知道一些我们不知道的事……

今年早些时候,Facebook给我推送了一项调查:“我们需要您对行动辅助工具的专业见解。出于好奇,我点了进去,发现内容是筛选自己喜爱的轮椅样式。一周后,我的推送里出现了一则广告,是为听障人士设计的高音量闹钟,随之而来的是视力辅助设备,产后抑郁恢复,以及营养咨询广告。

我的确有些身体上的不便,研究身体残障也是我工作的一部分。所以把我列为残障辅助工具的受众也合情合理。然而我从未使用过轮椅之类的助行器,因此也没法提出任何专业性建议。讽刺的是,对于一个记录用户所有人际关系和重要事件的网站来说,我的身心状态都不符合网页广告对我的判断。难道所有研究身体残障的人都是残疾人吗,亦或是所有残疾人都使用轮椅?

我并没有觉得被冒犯,事实上,我被这些大胆的算法吸引住了,它们默默地对我进行诊断,再给出某种“处方”,因为它们认为广告产品可以帮到我。但无论我是否需要这些产品,这些算法都会让人觉得自己有缺陷,即我身心有问题,而这些产品可以帮我解决它。运用这种“自动诊断”的方法可以认识我们眼中的自己和数据眼中的自己,并看看这两个认知是如何互相影响的。算法感知人类的方式及其无法正确看待我们这件事,透露了许多残疾分类以及我们的身体是如何有序组织的。这些障碍限制了人们以更深刻,更富同情心的方式来思考各种身心需求。

广告商使用算法的逻辑与健康和医学趋势的逻辑是一样的,只不过用数据更有说服力。

数据“成精”究竟有多可怕?网络怎么知道我快秃了?

图源:pexels

在实用且精准的广告投放中,网络服务会对用户的行为数据进行收集,处理与合成,最常见的是在特定网站上分享的决定和信息,数据跟踪cookies和其他能辨认出个人信息的数据。传统广告商会购买特定的广告位,而现在的广告商会根据目标客群,进行针对性广告投放,并不断对广告投放效果进行再评估。

有关实用广告投放对隐私的影响以及在线体验操控的说法已经不少,然而对算法导向型广告如何隐式地诊断并给出相应“处方”则研究较少。

疾病诊断通常是搜集身体情况和病史信息,根据已知的医学知识来处理症状及病史。疾病诊断与算法的概念类似,都是一步一步解决问题或者达到某个目标的过程。精准广告投放也是机器学习取代人类决策的另一个例子,因此开发者会说是人存在偏见,犯了错误。

这些算法不仅试图拉拢理想客户,还在一定程度上创造了客户。算法收集的数据形成了一个自己的翻版,不是“自己”,又并非“不是自己”。数据构成的自我翻版能综合分析个人电子足迹,比如,购买记录、搜索历史、甚至线上人际关系。它就像我们的影子,但绝不是镜子里的自己。不如说更像扭曲的映射,影响我们自己和别人看待我们的方式。

监控学专家大卫∙里昂提出了“社会分类”这个概念,收集整理数据,设计特定受众就是一个例子。电子监控的首要目的并非简单地辨认出捣蛋的人,而是利用数据将不同的人进行分组,最后达到监测的目标。由于广告的作用之一就是让受众觉得自己需要某样东西,所以广告才会不停强调某种缺失感——这一个性化流程的监测呈现出一种与受众之间,经过判断的,且不为人知的亲近关系,根据性别,收入,种族和国籍将人们分成不同的社会经济群体。

数据“成精”究竟有多可怕?网络怎么知道我快秃了?

图源:pexels

人们的搜索历史会揭露更多平时不愿分享的私人生活。算法似乎比最亲密的朋友和家人更了解自己的私生活,这一点让很多人都莫名恐怖。2012年,一个年轻女孩试图向家人隐瞒自己怀孕的事实,但Target给她发了婴儿用品的优惠券。她爸爸走进超市,跟经理投诉其乱发优惠券的行为,但实际上这个女孩的网络浏览记录说明,Target比她家人更了解她的身体状况。

还有人反映,自动诊断让他们觉得很不安,作家赛思·斯蒂芬斯·达维多维茨(Seth Stephens-Davidowitz)就曾发问:“网络怎么知道我快秃了?“从未公开表明自己脱发的他总能收到生发膏广告。这些广告算法精准得令人发指,它们对我们的身体和精神状态做出分析,却毫无踪迹可循。

在算法失灵的情况下,比如我并不使用轮椅,比如那个年轻女孩没有怀孕——一些人可能会喜欢这些错误,这表明数据跟踪与算法并不像技术专家声称的那样精确。换言之,监测完全失灵了,我们不知不觉欺骗了系统,隐藏了真实的自我。

但这些算法究竟对我们了解多少呢?,对于广告商可以使用哪些数据来生成个性化产品推荐,每个社交媒体平台都有不同的规定。面对众多批评和潜在的官司,2019年5月,Facebook公布了关于其广告投放准入标准的变动,尤其对医疗类广告商产生了很大影响。为避免歧视,Facebook附属广告商禁止投放基于种族、收入水平、性别取向、身体残障及购买记录形成的广告。然而虽然不能直接使用这些因子,算法仍可以通过分析其他数据建立用户画像。

电子监控通用准则的设立还需时日。目前为止,算法收集了多少信息,利用了哪些信息来做决策都难以界定。实用广告的兴起,与医保电子化、自动化以及视保持健康为自身责任的行为是相呼应的,这种责任使很多人都产生罪恶感,于是陷入对自我提升的长期追求中。健康是人们值得追求的理想状态,这使得很多人去买一些所谓有预防功效或可药到病除的产品和服务,包括那些整天出现在推送广告中的产品。

我们的身心并不无问题需要解决,只是存在个体差异。

实用广告投放是向医学数字自动化迈出的一大步。专业医疗人员如今倾向于使用辅助性的诊断算法来使诊断流程化,标准化。在线症状检查和健康手表的兴起也拉远了医生和病人之间的距离。广告商使用算法的逻辑和这些医学趋势是一样的,并且数据更具说服力。虚拟的自动化诊断能从一个人的个性中提取出数据,并将其标准化。重要的是,医生或售货员都无需与病人或顾客面对面进行沟通或决策,而机器甚至都没有接触过我们的身体,就能作出决策。

在身体残障研究中,残疾被视为社会、生理和心理的一种状态,但也是一种身份。我们的身心并无问题需要去解决,只是存在个体差异。我们都需要明白社会对残疾的看法是如何产生和扩散的。如果是自动诊断,商家声称自己的产品有某种“治愈“效果,这些看法就会在商家的宣传中产生并扩散。“残疾”通过算法定义,也通过算法解决。这只是另外一种数据模式,也就是人类设计出能反映社会偏见和对身体残疾认知的数据模式。

对残疾的自动监测反映了定义残疾是存在一个数据标准的。这将残疾的身份和体验概括化,强调了残疾和非残疾的划分。这个二分法只是另一个识别和定义我们身体价值的办法。我们都知道,二分法的思想可以简化对自己和他人的身份认知,将每个人都限制在和网络广告方框那样小的范围里。

每次看到推送里的错误诊断,我都习惯性地去无视它们。虽然我不用轮椅,但要算法定义我和目标客群的区别其实并不容易。可能我和轮椅使用者的网络行为数据之间有交叉的地方。可能残疾人和非残疾人之间的二分法使得我们的网络身份和真实身份背道而驰。可能我们的数据能知道一些我们自己不知道的事情,因为即使算法存在愚蠢的缺陷,它们还是能教会我们许多东西。

数据“成精”究竟有多可怕?网络怎么知道我快秃了?

数据“成精”究竟有多可怕?网络怎么知道我快秃了?

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

相关推荐