世界需要Cliqz,世界需要更多的搜索引擎

WEB程序员 2020-03-18

【金融特辑】光大银行科技部DBA女神带你从0到1揭秘MGR

世界上只有很少的真正独立的搜索引擎。谷歌,必应,Yandex和百度是最著名的公司。大多数其他参与者只是对这四家搜索引擎结果的再加工,并且依赖于它们的功能和商业模式。又或者独立搜索引擎是非常本地化并且规模很小,不能成为大搜索引擎的替代。尽管如此,我们在Cliqz在努力创建这样一个搜索引擎:在过去的五年中,大约有100名员工,我们从头开始构建了自己的搜索引擎beta.cliqz.com。它是完全独立的,不使用任何人的技术或任何业务模式。它是从采集,爬虫和分析数据到实际显示结果的端到端构建的,所有这些都从设计之初就保证隐私。我们为此感到自豪。到这个圣诞节之前的每一天我都会解释一个核心功能。

世界需要Cliqz,世界需要更多的搜索引擎

但是我们想从一个更基本的问题开始这个博客:为什么?为什么一个团队会有动力构建另一个搜索引擎?为什么休伯特·伯达媒体(Hubert Burda Media)会在这几年内为此提供资金(特别是在情况变得艰难时,他们会继续支持我们)?为什么我们选择将自己的时间和职业投入到似乎如此巨大和不可能的工作中?

因为拥有93%搜索市场份额的谷歌是垄断企业。没错,世界上还有其他垄断。有些受到法规的约束,有些则具有破坏性。人们可以说谷歌的产品不好,甚至这些产品是免费提供给用户使用的。与其他垄断相比,很难看出Google在哪里造成了伤害。也很难指责Google收费过高。但是我们实际付出的代价是很高的。高于金钱:因为Google垄断了信息。他们当然不控制世界的信息,但是控制世界对信息的访问。

世界需要Cliqz,世界需要更多的搜索引擎

图1:Google在全球的搜索市场份额高达93%[1]

Google对信息的垄断:量变到质变

伴随着93%的市场份额,谷歌的算法决定了什么才是真相。您能想像一个拥有93%观众的电视频道吗?如果只有一个电视频道,您会接受吗?听起来很荒谬,对吧?甚至真理报(1918年至1991年间苏联共产党中央委员会的机关报)都没有这样的俘获听众。这就是真实的Google。当然,他们会声称它们只是一个平台。他们会为自己辩护,他们不生产新闻,不要创建或编辑内容。从技术上讲这是正确的。但这实际上是错误的。如果平台是唯一的平台,则不必生产新闻,只需指向特定新闻,就足以对公众舆论产生深远影响并改变世界。无论这种影响是有意还是无意的,都是危险的。量变到质变的瞬间,很早就发生在Google身上了。

虚幻的真理效应

自从Google从网站中提取答案(“事实”)以来,这种情况更加的恶化和被放大--这是Google试图将流量和金钱留在Google的尝试。显然这种方式运转的挺好。现在,不到一半的搜索结果将你导向另一个网站。超过一半的搜索结果还是指向Google自己[2]:我们已经到达了使用/不使用Google检索信息的临界点。用户可能会相信他们看到的一切都是事实。但是Google会从任何网站(无论好坏)中提取这些答案。Google不是维基百科,没有社区管理。没有多种争论的声音,没有检查,没有制衡。如果Google规模不大,这都不是问题。在这里,Google选择的一个答案成为93%的用户的搜索结果。而当重复某件事的次数足够多时,即使是虚假的,也变成了真理。

世界需要Cliqz,世界需要更多的搜索引擎

图2:盗窃是否合理?有关这方面的书籍章节已经写好。但是Google有一个突出的四行答案。如果Google不会那么大,这将不是问题。通过他们的信息垄断,他们的答案成为事实。

我们打开了审查的大门

信息访问的单点也很容易受到攻击。整个市场的主导地位为审查制度打开了大门:对所有网络发布者进行审查非常困难,甚至不可能。多样性保持民主的强大。 因为总是会有一位不屈服压力的编辑,他会发表诚实的观点和不同的视角,为举报者腾出空间。相反,审查一个集中的实例非常容易。如我们所见:如果Google想要在中国开展业务,他们将必须遵守规定的标准。没有谁不会屈服。

Google是加强版的剑桥分析公司

(剑桥分析公司,是一家进行资料探勘及数据分析的私人控股公司。2018年3月以不当取得5000万Facebook用户数据而闻名),我们在网络上的数据使我们极易受到攻击。Google知道关于我们的一切。在最近的一项研究中,显示Google监视了82%网络流量的。但是这些精准的数据资料很容易被滥用。数据被汇总后不仅可用于创建量身定制的广告活动。它们还可以用来榨取每个客户的最大支付意愿。它们为精确宣传提供了完美的媒介。在最好的情况下,这只会导致我们购买不需要的东西,或者以高价购买一些原本可以更便宜的东西。在最坏的情况下,他们会利用我们的恐惧,我们的秘密来影响我们的政治决定。我们在这里不是讨论Google是否邪恶,而是为了保护我们最宝贵的资产之---信息--不被垄断者所拥有或控制。

你认为剑桥分析公司是一个问题?那Google更是加强版的剑桥分析公司:搜索引擎的操纵潜力更高,因为用户期望搜索引擎提供客观的结果。实际上无法检查算法是否是真正的客观(我们可能还要进行更长的讨论,即算法永远不可能是客观的),是否是个性化的结果(过滤泡),是否被用来对我们产生负面影响。如果有很多搜索的选择,而且Google规模不算太大,这也不成问题。但是由于Google在市场上的主导地位,即使搜索结果的最小变化,甚至自动建议的很小变化,也会影响我们的行为。

当使用搜索引擎时,得到的结果中观点是十分单一的

但是:人们仍然可以转向其他7%市场份额的搜索来获得不同的搜索结果,不是吗?好吧,看起来似乎有各种各样的具有不同算法的小型搜索引擎,实际上并非如此。在西方世界,几乎没有竞争对手建立自己的独立搜索索引。可能是出于成本和技术原因。他们中的大多数人都使用Bing(例如DuckDuckGo,Yahoo,Qwant或Ecosia)来提供搜索结果,甚至更糟的是使用Google(例如Startpage或ask.com)。它使我们误以为自己有的选择。实际上,我们只能在一个大玩家和另一个玩家之间进行选择。在电视世界中,这相当于100个不同的频道,但是它们全天24小时播放福克斯新闻,只需替换台标即可。显然这不好。

谷歌购买力的影响力远远超出了他们自己的平台,保护了他们的垄断地位

谷歌的影响力远大于“仅仅搜索”,他们控制并设定了大多数网络的标准:仅谷歌一家就控制了数字广告收入的37%。谷歌、Facebook和亚马逊加起来只占所有的数字广告花费中不到70%(!)[3]。这会给你带来很大的影响力,远远超过他们自己已经占据主导地位的地位。通过金钱,他们将把自己的价值观,他们的网络方式,以及他们的商业利益推向整个生态系统。2018年,谷歌向合作伙伴支付了267亿美元。也就是说:他们每挣一美元就花掉四分之一,以保持自己的主导地位和影响力。一些例子?Mozilla:超过90%的收入来自搜索合作伙伴关系[4]。苹果:估计他们从谷歌那里得到了100亿美元(每年!)[5] 是的。甚至还没算硬件制造商和安卓(Android)的交易(在那里,谷歌因行为不端和抢夺市场而被正式处以巨额罚款)。你真的认为这些经常完全依赖谷歌资金的合作伙伴会对谷歌采取行动或创新,挑战他们对待隐私和商业模式的方式吗?拿人手短,吃人嘴短。我们发现,我们最近成了这个游戏方式的附带损害。

Google的信息垄断对于任何民主国家都是不可接受的

喜欢Google的原因很多。他们拥有优秀的员工,而且他们开始于很伟大的愿景。但是,无论你多么喜欢他们,无论他们的产品有多好,无论你多么相信他们心中的良好愿景--如果Google成为数字世界唯一的过滤条件,那么这显然对我们的民主和社会没有好处。套用Monty Python的话说:“谷歌曾经为我们做过什么?”。他们为社会,为网络做了很多事情,很可能在很久以前就挽救了它。但现在是时候把他们看作是他们已经成为的帝国了。而帝国必须被打败。

在许多民主国家,媒体受到严格监管是有原因的。不同的媒体公司常常不允许合并也是有原因的。我们不出售所有的广播和电视广播许可证给同一个出价最高的投标人也是有原因的。常识告诉我们要确保信息的多样性。有这样一个世界,我们最重要的问题只能通过一种算法得到答案,由谷歌的工程师决定优先考虑什么?我们真的想要一个这样的世界吗?

如果你不明白为什么一个拥有93%信息垄断的人会对民主和自由构成风险,那么你不应该在网上读博客文章,而应该读一些历史书。

Cliqz,搜索引擎,还有你

搜索当然不是数字化带来的唯一问题。这也不是唯一应该解决的问题。然而,这是我们选择在Cliqz解决的问题。我们选择了构建这项技术,而不仅仅是为现有的解决方案套上一层壳。我们选择了隐私而不只图方便。所有这些都要付出巨大的代价——也许这甚至会对我们公司构成威胁。我们愿意为此付出代价,因为搜索是需要解决的问题。搜索是我们选择解决的问题。

但是没有你我们无法解决这个问题:你的每一个查询都会使Cliqz成为一个更好的搜索。不要满足于便利而忽略更加多样化的网络架构。不要妥协于现状,就和信息垄断和解。给我们反馈并参与讨论。不要接受现状。

相关推荐