必威足球机器学习的思考方式

机器学习的爆炸式发展已经持续了四五年,几乎每个人都听说过它。不仅仅是初创公司每天都在形成,或者大型科技平台公司正在围绕它重建自己——科技界以外的每个人都读过《经济学人》或《商业周刊》的封面故事,而且许多大公司正在进行一些项目。必威足球我们知道这是下一个大事件。

更进一步,我们基本上了解了神经网络可能是什么,理论上,我们知道这可能是关于模式和数据。机器学习让我们在数据中发现模式或结构,这些模式或结构是隐式的和概率的(因此“推断”),而不是以前只有人类而不是计算机才能发现的显式的。它们解决了以前“对电脑来说很难,对人来说容易”的一类问题,或者,也许更有用的是“对电脑来说很难描述的问题”。我们也看过一些很酷(或者令人担忧,这取决于你的看法)的演讲和视觉演示。

不过,我不认为我们对什么是机器学习有一个明确的认识手段-它对科技公司或更广泛经济中的公司将意味着什么,如何从结构上思考它可以使什么新事物成为可能,或者机器学习对我们所有人意味着什么,以及它实际上可能能够解决什么重要问题。

“人工智能”这个词也没帮上什么忙,它往往会让谈话一开始就结束。当我们说“人工智能”的时候,就好像2001年初的黑色巨石出现了,我们都变成了冲着它尖叫、挥舞拳头的猿类。你无法分析“人工智能”。

maxresdefault.jpg.

事实上,我认为人们可以提出一系列无益的方式谈论机器学习中当前发展。必威足球例如:

  • 数据是新的石油

  • 谷歌和中国(或Facebook或亚马逊或蝙蝠)拥有所有数据

  • ai将拿走所有的工作

  • 当然,还有人工智能本身。

更有用的事情可能是:

  • 自动化

  • 使技术层

  • 关系数据库。

为什么关系数据库?它们是一个新的基本实现层,改变了计算的功能。在20世纪70年代后期出现关系数据库之前,如果您想要您的数据库向您显示,比如“所有购买该产品并居住在这座城市的客户”,那么通常需要一个定制的工程项目。数据库的结构不允许任意的交叉引用查询是一件容易的、常规的事情。如果你想问一个问题,就得有人把它造出来。数据库是记录保存系统;关系数据库把它们变成了商业智能系统。

这在许多重要方面改变了数据库的用途,从而创造了新的用例和新的十亿美元的公司。必威足球关系数据库给了我们甲骨文,但也给了我们SAP, SAP及其同行给了我们全球即时供应链——他们给了我们苹果和星巴克。到20世纪90年代,几乎所有的企业软件都是关系数据库——PeopleSoft、CRM、SuccessFactors和其他数十个软件都运行在关系数据库上。没有人看过SuccessFactors或Salesforce后会说:“这是行不通的,因为甲骨文拥有所有的数据库”——相反,这项技术成为了一切的一个支持层。

所以,这是今天思考ML的一个很好的基础方式——这是我们可以必威足球用计算机做的一个步骤的改变,这将成为许多不同公司的许多不同产品的一部分。最终,几乎所有的东西都将包含ML,没有人会在意。

这里的一个重要并行是,尽管关系数据库具有规模效应的经济性,但有限的网络或“获胜者采取所有”效果。如果B公司从同一供应商购买相同的数据库软件,则公司使用的数据库不会变得更好:如果CaterPillar购买相同的数据库,则Safeway的数据库不会更好。必威足球实际上适用于机器学习的情况非常相同:机器学习是关于数据的,但数据对特定应用是高度特异性的。更多的手写数据将更好地制作手写识别器,更好的燃气轮机数据将使一个系统更好地预测燃气轮机的故障,但是另一个没有帮助另一个。数据不是可替换的。

这得到的最常见的误解,在讨论机器学习,在某种程度上它是一个通用的东西,在哈尔9000,谷歌和微软都建立了* *,或者谷歌所有的数据,或者IBM已经真正的所谓“沃森”。必威足球真的,看待自动化总是错误的:在每一波必威足球自动化浪潮中,我们都会想象我们正在创造一些拟人化的东西或具有一般智能的东西。在20世纪20年代和30年代,我们想象钢铁工人拿着锤子在工厂里走动,在20世纪50年代,我们想象类人机器人在厨房里走动做家务。我们没有机器人仆人,我们有洗衣机。

屏幕截图2017-11-02 at 4.44.52 PM.png

洗衣机机器人,但他们不是'聪明'。他们不知道什么水或衣服。Moreover, they're not general purpose even in the narrow domain of washing - you can't put dishes in a washing machine, nor clothes in a dishwasher (or rather, you can, but you won’t get the result you want). They're just another kind of automation, no different conceptually to a conveyor belt or a pick-and-place machine. Equally, machine learning lets us solve这些问题以前计算机不能有效地解决,但是每一个问题都需要不同的实现方法,不同的数据,不同的进入市场的途径,通常还需要不同的公司。每一个都是自动化的一部分。它们每一个都是一台洗衣机。

因此,谈论机器学习的挑战之一是在数学的机械解释和对一般人工智能的幻想之间找到中间地带。机器学习不会创造出HAL 9000(至少,在这个领域很少有人认为它会很快这样做),但称之为“仅仅是统计”也没有用。回到与关系数据库的相似之处,这可能有点像1980年谈论SQL——您是如何从解释表连接到考虑Salesforce.com的?说“这让你可以问这些新类型的问题”很好,但它并不总是很明显必威足球什么的问题。你可以做令人印象深刻的语音识别和图像识别的演示,但是,一个普通的公司会怎么做呢?正如美国一家大型媒体公司的团队不久前对我说的那样:“好吧,我们知道我们可以用ML来索引我们人才采访运动员十年的视频——但我们要找的是什么呢?”

那么,是什么是机器学习的洗衣机,为真正的公司?我认为有两套思考这个工具。首先是根据数据类型和问题类型的游行思考:

  1. 机器学习作为一种分析或优化技术,可能会对你已经问过的问题和你已经拥有的数据提供更好的结果。例如,我们的投资组合公司Instacart建立了一个系统为了优化它的个人购物者通过杂货店的路线,提高了50%(这是由三个工程师使用谷歌的开源工具Keras和Tensorflow构建的)。

  2. 机器学习可以让你对已有的数据提出新的问题。例如,执行discovery的律师可能会搜索“愤怒的”电子邮件、“焦虑的”或异常线程或文件集群,以及进行关键字搜索,

  3. 第三,机器学习为分析开辟了新的数据类型——在此之前,计算机无法真正阅读音频、图像或视频,而现在,这将成为可能。

在这里面,我发现想象是最令人兴奋的。自从我们有电脑以来,电脑就能够处理文本和数字,但图像(和视频)大多是不透明的。现在他们可以像“阅读”一样“看”了。这意味着图像传感器(和麦克风)成为一种全新的输入机制——与其说是一种“相机”,不如说是一种新的、强大的、灵活的传感器,它可以生成(可能)机器可读的数据流。所有的事情都将变成计算机视觉问题,而不像今天的计算机视觉问题。

这不是识别猫的照片。最近我遇到了一个公司,为汽车行业提供座椅,这使神经网络在一个廉价的DSP芯片廉价智能手机的图像传感器,来检测是否有织物起皱(我们应该期待各种类似的用途机器学习非常小,便宜的小部件,只做一件事,作为描述在这里)。将此描述为“人工智能”是不用的:它是一个以前无法自动化的任务的自动化。一个人必须看。

这种自动化感是第二种用于机器学习的工具。发现是否有织物皱纹不需要20年的经验 - 它真的需要哺乳动物脑。实际上,我的一位同事建议机器学习将能够做任何你可以训练狗的事情,这也是一个有用的思考AI偏见的方法(什么必威足球究竟这只狗学会了吗?培训数据中有什么?你确定吗?你怎么问的?),但也有局限性,因为狗确实有一般的智力和常识,不像我们知道如何建立的任何神经网络。Andrew Ng认为ML可以在不到一秒的时间内完成所有你能做到的事情。谈论曼梯·ML的确是在寻找隐喻,但我更喜欢这样的隐喻:它给了你无限个实习机会,或者,可能是无限个十岁的孩子。

五年前,如果你给了一堆照片,那么它就不能超过它们的大小。十岁的孩子可以将它们分为男人和女人,十五岁的孩子变成酷,肆虐,实习生可以说'这个真的很有趣'。今天,用ML,电脑将匹配十岁,也许十五岁。它可能永远无法进入实习生。但是如果你有一百万十五岁来看你的数据,你会怎么做?您会听取哪些电话,您可以查看哪些图像,以及您检查哪些文件转账或信用卡付款?

也就是说,机器学习不需要与专家、几十年的经验或判断相匹配。我们不是自动化专家。相反,我们要求的是“倾听所有的电话,找出愤怒的人”。“阅读所有的邮件,找到那些令人焦虑的”。“看看成千上万的照片,找出那些很酷(或者至少很奇怪)的人。”

从某种意义上说,这是自动化一直在做的事情;必威足球Excel没有给我们人工会计,Photoshop和Indesign没有给我们人工图形设计师,实际上蒸汽机也没有给我们人工马。(在早期的“人工智能”浪潮中,国际象棋计算机并没有给我们一个装在盒子里的脾气暴躁的中年俄罗斯人。)相反,我们大规模地自动化了一个离散的任务。

Where this metaphor breaks down (as all metaphors do) is in the sense that in some fields, machine learning can not just find things we can already recognize, but find things that humans can’t recognize, or find levels of pattern, inference or implication that no ten year old (or 50 year old) would recognize. This is best seen Deepmind’s AlphaGo. AlphaGo doesn’t play Go the way the chess computers played chess - by analysing every possible tree of moves in sequence. Rather, it was given the rules and a board and left to try to work out strategies by itself, playing more games against itself than a human could do in many lifetimes. That is, this not so much a thousand interns as one intern that’s very very fast, and you give your intern 10 million images and they come back and say ‘it’s a funny thing, but when I looked at the third million images, this pattern really started coming out’. So, what fields are narrow enough that we can tell an ML system the rules (or give it a score), but deep enough that looking at所有这些数据可能会带来新的结果,这是人类无法做到的。

我花了很多时间与大公司会面,讨论他们的技术需求,他们在机器学习方面通常都有一些很容易实现的目标。有很多明显的分析和优化问题,还有很多明显的图像识别问题或音频分析问题。同样,我们讨论的唯一原因自动汽车和混合现实是因为机器学习(可能)使他们- ML为汽车提供了一条解决周围的人类司机可能要做什么,并提供混合现实的方法找出我应该看到,如果我看起来虽然一副眼镜必威足球可以显示任何东西。但在我们讨论了面料上的褶皱或呼叫中心的情绪分析之后,这些公司往往会坐下来,然后问:“哦,还有什么?”“它还能带来哪些其他事情?它还能发现哪些未知的未知因素?”在这变得无聊之前,我们可能还有10到15年的时间。

人工智能 betway足球