循环中的人类

今天的互联网平台的悖论之一是它们大大自动化,并没有人类控制或交互在任何给定的人所看到的,然而,他们也完全依赖于人类的行为,因为他们真正做的是观察,提取和推断从数百万或数十亿人做什么。

这是一个普及的创世记。除了依靠手工制作的规则来了解每个页面可能是什么,或索引原始文本,PageRank看看人们所做的或已经说过该页面。谁链接到它,他们使用了哪些文字,谁与链接到它的人挂钩?在管道的另一端,Google获取每个用户用手策划每组搜索结果:它为您提供了10个蓝色链接,您可以告诉谷歌哪一个是正确的。Facebook的同样的事情:Facebook真的不知道知道你是谁,你对什么感兴趣,或者内容是什么。它知道你在关注谁,你点了什么“赞”,还有谁喜欢这个,他们还喜欢和关注了什么。Facebook对人们来说是PageRank。同样的道理也适用于YouTube:它永远不知道视频是什么,只知道人们在视频旁边输入了什么,以及他们看了什么,喜欢什么。

实际上,这些系统是巨大的机械突厥人。他们不知道任何事物本身是什么——相反,他们试图在这些事物周围创造、捕捉和引导人类的注释。它们是庞大的分布式计算系统,其中cpu是人,平台是路由器和互连。(这让我想起了《银河系漫游指南》(Hitchhiker’s Guide to the Galaxy)中的一个想法,即整个地球实际上是一台巨大的、专门设计的计算机,我们的日常生活都是计算的一部分。)

这意味着很多系统设计都在寻找适当的杠杆点,以将人们应用于自动化系统。你捕获已经发生的活动吗?谷歌开始使用已经存在的链接。您是否必须刺激活动以捕获其中的价值?Facebook必须在使用之前创造行为。你能把自己的人应用于极端杠杆的一点吗?这是Apple Music的方法,手动策划播放列表匹配自动达到数百万用户。或者你必须付钱给人们做'所有'吗?

原来的雅虎互联网目录是一个尝试的“付钱人员做所有的方法” - 雅虎付费了整个网上的目录。首先,这种看起来可行的,但随着网络脱掉它很快成为一个不可思议的大问题,而雅虎放弃该目录已经过了3M页。答案是pagerank。相反,谷歌地图现在有人(现在)沿着地球上几乎每条街道和其他人看着图片的驾驶汽车,这不是一个不可能的大问题 - 这只是一个昂贵的问题。谷歌地图是私人机械土耳其人。我们现在正在探索同样的问题,具有人类的社会内容 - 您需要查看每个帖子的数万人,以及您可以自动化多少?这是一个不可能的大问题还是只是一个昂贵的问题?

如果你看看这些平台,用数十亿人来做实际的计算,这引发了两个有趣的问题:这告诉我们关于平台滥用的什么情况,以及机器学习能在多大程度上改变这一切?

在过去,当我们考虑滥用计算机系统时,我们考虑了各种类型的技术利用 - 被盗或弱密码,未斑点系统,错误,缓冲区溢出和SQL注入。我们考虑了“黑客”在软件工程中找到差距。但是,如果YouTube或Facebook是分布式计算机系统,路由器是古板的软件,但CPU是人,那么一个糟糕的演员就会想到在人们和软件中找到漏洞。常见的认知偏见变得像常见的编程错误一样重要。

也就是说,有两种方法可以抢劫银行 - 您可以绕必威足球过闹钟并在保险箱上挑选锁,或者您可以控制管理器。这些都是处理系统失败的方式,但必威足球现在一个处理系统是我们的。因此,正如我写的那样这里看Facebook最近的私隐和安全性,这些平台上的数据的人为审核在概念上非常类似于在二十年前在Windows上响应恶意软件的软件病毒扫描仪非常相似。计算机的一部分观看另一部分,看看它是否正在做的事情。

即使不考虑故意虐待,用人类活动来分析人类活动也存在固有的问题。一旦你开始使用计算机分析计算机,你就有可能产生反馈循环。你可以在过滤器泡沫的想法,或“YouTube激进化”,甚至SEO垃圾邮件中看到这一点。与此同时,Facebook面临的一个问题是,有时拥有或产生更多数据会降低数据的价值。这就是新闻提要超载的问题:你添加了50或150个朋友,你每天分享5或10个东西,但所有人都分享,所以你每天的新闻提要中有1500个条目。邓巴数+扎克伯格定律=超载…这就引出了古德哈特定律。

“任何观察到的统计规律,一旦出于控制目的而施加压力,就会趋于崩溃。”- - -查尔斯古特哈特

机器学习现在正在改变这种杠杆点可能。它开辟了自动化一类以前需要人们的问题 - 也许数百万或数十亿人。但它实际上并没有删除人民 - 它只是将它们移动到其他地方,并使它们复制。

在过去,如果您有一只猫的照片,如果您有足够的用户(或员工或主持人),它只能标记为“猫”,以便有人会查看并标记特定图像。今天,您不需要任何用户看那个特定的猫图片 - 您只需要其他其他用户,在其他地方,在过去的某个时刻,已标记到足够其他用猫的照片来生成一个像样的识别模型。那么,你以前能解决多少问题,如果你应用了数百万人或数亿人的聚合行为,而现在你可以用机器学习来解决,而不需要任何用户你自己的?实际上,您将机械土耳其人转变为您可以自动化的东西。

这只是一种利用人的形式:你需要人们做标签(并编写人民如何做标签的规则)。但是,我们移动了杠杆点,也许是根本上的改变,我们需要多少人,所以我们改变了一些“获胜者采取了所有”的影响。毕竟,这些巨大的社交平台是巨大的手动标记数据集合,所以玻璃半空或半满?玻璃半满:它们具有世界上最大的手动标签数据集合(在其所选域中)。玻璃半空:它是手动标记的。

AI. betway足球