聊天机器人,对话和人工智能作为界面

聊天机器人利用了两个非常流行的关注点。一方面,人们希望它们能够发挥作用,这反映了人工智能的持续爆炸式增长,另一方面,它们提供了一种无需用户安装应用就能接触到用户的方法。必威足球

看看任何必威足球人工智能问题的一种方法,在用最简单的术语,是问解决这个是否需要“一般人工智能”或你的域名是否足够窄,您的解决方案广泛并且足够灵活,可以处理一个足够宽的比例没有HAL 9000潜在的场景。也就是说,我们已经很接近制造出一辆无需人力投入就能在高速公路上行驶的汽车了,因为可能发生的事件范围非常小,但在罗马或莫斯科市中心驾驶是不是完全不必威足球同的事情,需要完全不同的决策级别?那个手势是什么意思?

因此,将AI插入“对话式”聊天机器人界面的挑战在于,你没有HAL 9000,但在某种程度上要假装你有。你对它说话,它也会回应,它会使用自然语言(不管是语音还是文本),但它根本不是一般的人工智能。那么,用户有多大可能会问一些破坏它的问题呢?能有多糟?他们可能会问的问题的范围有多窄,您如何定义用户的期望以使他们理解该领域?也许更重要的是,你能让人们接受这个域名吗?

要了解这个问题必威足球的实际情况,一个很好的方法是现在比较Siri和谷歌,它们当然都是机器人他的语言。谷歌现在是基于推送的-它只会在它认为有东西给你的时候说什么。相比之下,Siri必须应对被问到的任何问题,当然,它不可能总是理解。必威足球谷歌现在通过保持沉默来填补空白,而Siri则会用一些固定的笑话来填补空白,或者给出你可以问的一系列问题。实际的智力可能是一样的,但你看到Siri失败。

相反,Siri的“这就是你可以问的”屏幕本质上是一个命令行帮助提示,而GUI的全部意义在于,你不需要知道你可以输入什么。虽然自然语言处理意味着你不需要知道Siri或机器人的具体语法,但仍然存在一个基本的发现问题——如果我不能问任何问题,我能问什么?

所有这些都意味着,就目前而言,机器人或对话式UI可能最适合一些非常具体的事情——用户知道他们可以问什么,而且这些是他们唯一会问的事情。然而,当它确实起作用时,它确实变得非常有趣,尤其是现在,因为它恰好与第二个关注点——绕过应用程序安装问题相当一致。

与其费尽心机说服别人安装你的应用,不如通过对话界面直接、流畅、简单地吸引用户?必威足球你能让聊天机器人成为继web和原生应用之后的第三个运行时吗?当然,这是否有比App Store更有效的获取用户的新方法?必威足球(换句话说,“别管人工智能的梦想——这会让我停止向Facebook捐款吗?”)

也就是说,对话式UI的即时承诺并不是你在自己的应用中所做的事情,而是它可以让你更容易地与用户交互,而不需要在一开始就安装应用。

这里的实际问题当然是,什么运行时?我们有智能手机操作系统及其api,我们有网络浏览器,但机器人的本地目标是什么?如果机器人是一个命令行UI,那么终端是什么?怎么传到电话上的?它是否有自己的元机制来获取用户和发现服务,以及运行时本身?这些在哪里?

一个很明显的智能手机趋势是,交互模式不仅会激增,而且会上下移动——上到新的应用程序,它们本身作为平台(Facebook,微信,地图等),下到操作系统(Siri, Now, deep links等)。智能程序也是如此:苹果还没有向开发者开放Siri(目前),但谷歌已经有选择性地开放了,对于操作系统提供商来说,创建任何新的运行时显然是战略上的可取之选。

然而,苹果和谷歌在这方面面临的挑战是另一端。他们可以在手机上安装一个机器人终端,但要让云端的任何东西通过你的手机与你交谈,该服务必须知道去哪里寻找。两家公司都有某种形式的云平台身份,但苹果的隐私策略排除了许多使用的今天,苹果和谷歌都没有一个平台这一差距或Instacart可能要求你登录当你订货,这样他们可以和你谈谈。当然,这种情况可能会改变——特别是有传言称苹果将把Apple Pay(以及Touch ID)扩展到网络,这为这个方向带来了很多可能性。

Facebook同时拥有两个终端——Messenger终端(目前拥有10亿移动mau)和网络身份识别平台。Facebook面临的挑战是另一个方面:发行商是否会给予它如此大的控制权,他们是否会相信Facebook能够在未来继续发展这个平台?

与此同时,我发现微软在“Build”上对机器人和相关工具的高度关注相当有趣,因为微软当然没有任何终端——它没有一个大众市场的智能手机平台或一个可以成为连接粘合剂的网络身份平台。(游戏邦注:Skype拥有3亿mau,但我并不清楚这是否是一个可行的终端。)但是很多微软的故事是关于建设云平台,让别人来创建机器人可以运行任何其他两个端点之间——Facebook Messenger或松弛之间的另一端和差距,通过Facebook的身份登录,但与实际能力来自微软。也就是说,微软是一个开发平台。当然,这也是谷歌的自我形象——如果谷歌不是一个理解和交流大规模数据的平台,那它是什么?

我故意使用,而复古的“终端”一词来形容这个地方机器人UI住在在电话里,因为这似乎是很多人的思维方式,有一个AI在云端,你跟它通过一个愚蠢的文本或声音UI在电话或电脑。必威足球这也反映了现在的工作方式——该设备主要是哑玻璃必威足球。这是我之前提到的交互层上下移动的延伸——在某种意义上,你是在将交互层完全移出设备。巧合的是,在智能手机出现之前,“终端”是电信公司用来指代移动电话的一个词,事实上,我所看到的许多聊天机器人的示例用例都可以用SMS或USSD完成。

但这并不是唯一的潜在模式。微信使用消息传递作为一个平台,但并没有将交互推低到“愚蠢的文本”的水平——它提供了自己的社交和获取模式,但大多数与第三方服务的实际交互都发生在丰富的用户界面中(多数是作为web视图构建的)。毕竟,如果你向用户提供一个只有两个选项的问题,你是应该告诉他们“你可以回答‘红色’或‘绿色’”,还是应该在聊天中给他们两个按钮?如果有五个选项呢?您是否应该为您的用户构建某种屏幕上的界面,以图形方式展示选项?也许你可以把它叫做“GUI”。你可以点击“链接”,加载新的“页面”……事实上,如果你让你的聊天机器人工作,这需要在Facebook上,还是可以在你自己的网站上?这取决于你想要什么样的互动,也可能取决于你是在解决自己的问题还是用户的问题。

有一个古老的计算机科学理念,计算机永远不应该问一个它应该能够计算出答案的问题。人工智能的一个承诺是你可以得到,不是一台电脑,你可以跟喜欢一个人,但你不需要说话,或更少,您可以删除的心理负荷和摩擦和维护与电脑或者在线服务。计算机可以问更少的问题,自己做更多的工作。(这有点类似于从Windows或Mac转移到iOS或Android所带来的脑力负荷的减少)。你不需要回到网站登录并编辑订单,只需发送一条信息:“取消那件衬衫,给我拿个绿色的包,而不是灰色的。”计算机应该能够解决这个问题,而且很可能也会这样做。你应该能够使用人工智能和聊天,以某种方式,以更少的工作实现相同的目标。必威足球但这并不是说这是解决所有问题的好方法。必威足球如果你花更多的时间去想怎么问人工智能助手,而不是把会议拖到日历上的新位置,那么你的做法就错了。一个人工智能不应该比仅仅按一下该死的按钮——一个有更好的流行词的IVR更有精神负担。 That might be a better user acquisition model for you, but that’s tough. And so this comes back to my opening point - is this a domain where you can just tell it what to do and move on, or one where the ‘general intelligence’ still needs to be between the chair and the screen?