必威足球考虑机器学习的方法

我们现在已经进入了机器学习的爆炸式发展四、五年,几乎每个人都听说过。这不仅仅是初创公司每天都在形成,或者大型科技平台公司正在围绕它进行自我重建——科技之外的每个人都读过《经济学人》或《商业周刊》的封面故事,许多大公司正在进行一些项目。必威足球我们知道这是下一件大事。

更进一步,我们主要是了解神经网络,在理论上,得到,这可能是关于模式和数据。机器学习让我们在数据中找到隐含的和概率的(因此“推断的”)而不是显式的模式或结构,以前只有人而不是电脑才能找到。他们回答了一类先前“对于计算机来说很难,而对于人来说很容易”的问题,或者,也许更有用,“人们很难用电脑来描述”。我们看到了一些很酷(或者令人担忧,取决于你的观点)演讲和演示。

我不认为,虽然,那我们还定居的机器学习意味着-这对于技术公司或更广泛经济中的公司意味着什么,如何在结构上考虑新事物可以启用,或机器学习意味着什么我们其余的人,以及它可能真正能够解决的重要问题。

这不是得益于“人工智能”这个词,一旦谈话开始,它就趋向于结束。当我们说“人工智能”,就像黑色的庞然大物从2001年开始出现,我们都变成了猩猩,对着它尖叫,挥舞着拳头。你不能分析“人工智能”。

jpg

的确,我认为人们可以提出一大堆的无益的方式谈论当前机器学习的发展。必威足球例如:

  • 数据是新的石油
  • 谷歌和中国(或Facebook,或亚马逊,或BAT)拥有所有数据
  • 人工智能将承担所有的工作
  • 而且,当然,说人工智能本身。

更多有用的事情可以谈,也许,可能是:

  • 自动化
  • 启用技术层
  • 关系数据库。

为什么要建立关系数据库?它们是改变计算能力的新的基本支持层。在关系数据库在20世纪70年代末出现之前,如果您希望数据库显示您,说,“所有购买这个产品并住在这个城市的顾客”,这通常需要一个定制的工程项目。数据库没有与结构建造,这样任意交叉引用查询是一个简单的,常规的事情。如果你想问个问题,有人必须建立它。数据库是记录保存系统;关系数据库将它们转变为商业智能系统。

这改变了数据库可用于在一些重要的方面,必威足球因此创建新用例和新价值数十亿美元的公司。关系数据库给我们甲骨文公司但他们也给了我们SAP,SAP和它的同行们给了我们全球即时供应链——他们给了我们苹果和星巴克。到20世纪90年代,几乎所有企业软件是一个关系数据库——仁科和CRM和数十个SuccessFactors一如其名关系数据库。没有人看成功因素或销售人员说因为Oracle拥有所有的数据库,所以这永远不会起作用更确切地说,这种技术成为了一个使层,是所有的一部分。

所以,这是今天思考ML的一个很好的基础方法-它是我们能用必威足球电脑做的一个步骤的改变,这将是许多不同公司的许多不同产品的一部分。最终,几乎所有的毫升内某个地方,没有人会在意。

这里的一个重要相似之处是,尽管关系数据库具有规模效应的经济性,有有限的网络或“赢家通吃”的效果。如果B公司从同一家供应商购买相同的数据库软件,A公司使用的数据库不会变得更好:如果卡特彼勒购买相同的软件,Safeway的数据库不会变得更好。必威足球机器学习实际上也同样适用:机器学习都是关于数据的,但是数据对于特定的应用程序是高度特定的。更多的手写数据将使手写识别器更好,更多的燃气轮机数据将使得能够更好地预测燃气轮机故障的系统,但是这个对另一个没有帮助。数据不可替换。

这得到的最常见的误解,在讨论机器学习,在某种程度上它是一个单一的、必威足球通用的东西,在哈尔9000谷歌和微软各自建造了一个*one*,或者谷歌“拥有所有数据”,或者IBM有实际的东西叫做“沃森”。真正地,这在观察自动化时总是必威足球错误的:在每一波自动化浪潮中,我们设想我们正在创造一种拟人或具有普遍智慧的东西。在1920年代和30年代我们想象的钢铁男人走来走去工厂拿着锤子,在1950年代我们想象的人形机器人行走在厨房做家务。我们没有得到机器人仆人——我们有洗衣机。

下午4.44.52时的截屏2017-11-02

洗衣机机器人,但他们并不是“聪明”。他们不知道水或衣服。此外,即使是在狭小的洗衣领域,它们也不是通用的——你不能把盘子放在洗衣机里,也没有衣服在洗碗机(或者更确切地说,你可以,但你不会得到你想要的结果)。他们只是另一种自动化,在概念上,与传送带或拾取放置机器没有区别。同样,机器学习可以让我们解决电脑不能有效解决的问题,但这些问题需要一个不同的实现,和不同的数据,另一条通往市场的路线,而且经常是不同的公司。每个人都是一块自动化。每个人都是一个洗衣机。

因此,在讨论机器学习的一个挑战是找到之间的中间地带的机械解释数学一方面和幻想一般人工智能。机器学习不会创建HAL 9000(至少,很少有业内人士认为它很快就会这么做。但是称之为“只是统计”也没有用。返回到与关系数据库的并行,这有点像1980年谈论SQL——从解释表联接到考虑Salesforce.com,您如何理解?说“这让你可以问这些新问题”很好,但这并不总是很明显的必威足球什么问题。你可以做令人印象深刻的语音识别和图像识别演示,但是,再一次,一个普通的公司会怎么处理呢?不久前,美国一家大型媒体公司的一个团队对我说:“嗯,我们知道我们可以用ML来索引十年来人才面试运动员的视频,但我们在寻找什么?”

什么,然后,是机器学习的洗衣机,真正的公司吗?我认为有两套思考这个问题的工具。第一种是根据数据类型和问题类型的处理进行思考:

  1. 机器学习可以很好地为您已经询问的有关数据的问题提供更好的结果,简单地作为一种分析或优化技术。例如,我们的投资组合公司Instacart建立了一个系统优化其个人购物者通过杂货店的路线,该杂货店提供了50%的改善(这是由三个工程师建立的,使用谷歌的开源工具Keras和Tensorflow)。
  2. 机器学习可以让你问你已经有新的问题的数据。例如,律师做的发现可能会搜索“愤怒”的电子邮件,或“焦虑”或异常线程或文档集群,以及进行关键字搜索,,
  3. 第三,机器学习开辟了新的数据类型分析——电脑可以不读音频,以前和现在的图像或视频,越来越多地,那将是可能的。

在这里面,我觉得拍照最令人兴奋。电脑已经能够处理文字和数字,只要我们有电脑,但是图像(和视频)大多是不透明的。现在他们能够“看到”,就像他们能够“阅读”一样。这意味着图像传感器(和麦克风)变成了一个全新的输入机制——与其说是一个“照相机”,不如说是一个新的,强大而灵活的传感器,可以产生(潜在的)机器可读数据流。各种各样的事情最终会变成计算机视觉问题,看起来不像今天的计算机视觉问题。

这不是认识猫图片。我最近遇到了一家为汽车工业提供座位的公司,它用廉价的智能手机图像传感器将神经网络放在廉价的DSP芯片上,检测织物中是否存在皱纹(我们应该期望在很小的范围内用于机器学习的各种类似用途,便宜的小部件,只做一件事,所述在这里)。把这个描述为“人工智能”是没有用的:它是以前不能自动化的任务的自动化。一个人必须看看。

这种自动化的感觉是思考机器学习的第二个工具。检测织物是否有褶皱并不需要20年的经验,它只需要哺乳动物的大脑。的确,我的一个同事指出机器学习能够做任何事你可以训练一只狗,这也是一个有用的方法人工智能的偏见(什么必威足球完全狗知道吗?培训数据是什么?你确定吗?你怎么问?)但也是有限的,因为狗的确具有一般智力和常识,不像任何神经网络,我们知道如何构建。Andrew Ng建议ML能够在不到一秒钟的时间内完成任何你能做的事情。谈论毫升倾向于寻找隐喻,但我更喜欢这个比喻,它给你无限的实习生,或者,也许,十岁的孩子。

五年前,如果你给电脑一堆照片,除了按大小排序,它别无他法。一百一十岁可以成男性和女性,一个十五岁的孩子变得酷而不酷,一个实习生可以说“这个很有趣”。今天,用ML计算机将匹配十岁,也许是十五岁。它可能永远不会到达实习生那里。但是如果你有一百万十五岁的孩子来查看你的数据,你会怎么做?你想听什么电话,你会看什么图像,你会检查哪些文件转账或信用卡付款??

也就是说,机器学习不需要匹配专家或几十年的经验或判断。我们不是自动化专家。更确切地说,我们要求“倾听所有的电话,找出愤怒的人”。阅读所有的电子邮件,找到那些焦虑的人。“看看十万张照片,发现那些酷(或者至少是怪异)的人。”

从某种意义上说,这就是自动化总是要做的;必威足球Excel没有给我们人工会计师,Photoshop和Indesign没有给我们人造图形设计师,蒸汽机也没有给我们人造马。(在早期的“人工智能”浪潮中,国际象棋计算机并没有给我们一个脾气暴躁的中年俄国人的盒子。)而是,我们使一个离散的任务自动化,大规模地

这个隐喻(就像所有的隐喻一样)在哪里失效,在某种意义上说,在某些领域,机器学习不能仅仅发现我们已经能够识别的东西,但是找到人类无法识别的东西,或者发现模式的层次,没有十岁(或50岁)会认识到的推论或暗示。这是最好的看到Deepmind AlphaGo。AlphaGo不玩国际象棋电脑下棋的方式——通过分析每一必威足球个可能的树在序列。更确切地说,这是考虑到规则和董事会,试图解决策略本身,玩比人类一生中能做的更多的游戏来对抗自己。也就是说,这与其说一千实习生作为一个实习生非常非常快,你给你的实习生1000万图片和他们回来,说的是一件有趣的事情,但当我看到第三百万张照片时,这种模式真正开始”。所以,哪些领域狭窄,以至于我们可以告诉一个毫升系统规则(或者给它一个分数),但是足够深全部的数据,因为没有人能做的,可能会带来新成果??

我花了很多时间会议大公司和谈论他们的技术需求,它们通常有一些非常清晰的低垂水果用于机器学习。有许多明显的分析和优化问题,和很多事情显然是图像识别问题或音频分析问题。同样,我们谈论自主汽车和混合现实的唯一原因是因为机器学习(可能)使它们能够-ML为汽车提供了一条路径,以弄清它们周围是什么,以及人类驾驶员将要做什么,并提供混合现实的方法找出我应该看到,必威足球如果我看一副眼镜能够显示任何东西。但在我们讨论过的皱纹在织物或情绪分析呼叫中心,这些公司倾向于坐下来问,“好吧,还有什么?“这还能够实现其他什么功能,和未知的未知,会发现是什么?我们可能有十到十五年之后才开始变得无聊。