增强现实的第一个十年

2006年2月,Jeff Han演示了一个实验性的“多点触摸”界面,作为一个“TED”谈话。我已经嵌入了下面的视频。今天看,他展示的东西似乎很老套——每50美元的Android手机就能做到这一点!-还有观众,大多是相对成熟和注重技术的人,喘息和鼓掌那时,平庸的现象令人惊叹。一年后,苹果公司发布了iPhone,多点触摸技术产业被重置为零。

\n“,“缩略图宽度:130,“被“解决”:YouTube,“商号”:YouTube,““版本”:1“,““解决”是的,““类型”:视频“,““AuthURL”:https://www.youtube.com/user/TEDtalksDirector”,“提供者URL:https://www.youtube.com/”,“哈希德:NULL,“拇指指甲:https://i.ytimg.com/vi/ac0E6deG4AU/hqdefault.jpg”,“身高:480,“宽度“:640,“解析对象:视频“,“浮标:NULL,““描述”:http://www.ted.com Jeff Han展示了一个便宜的,可伸缩的多点触摸和压力敏感的计算机屏幕接口,可能拼写结束点按。TEDTalks是TED会议的最佳演讲和表演的日常视频播客,邀请世界顶尖思想家和实践家在18分钟内发表关于他们生活的演讲。”}数据块类型="22““=”块yui_3_17_2_1_1491860116931_14294>

十年后回顾这一切,多点触摸实际上有4次发布。多点触摸曾经一度成为研究实验室中一个有趣的概念,在这一点上,第一批演示可能实际执行的操作开始出现在公众面前,第一个真正可行的消费产品出现在iPhone上的时候,然后,几年后,销售真正开始爆炸的时刻,随着iPhone的发展,Android也跟着发展。你可以在下面的图表中看到一些这种滞后——在2007年iPhone发布后几年,销售才开始起步(甚至在定价模式改变之后)。大多数革命性的技术都是这样出现的,分阶段地-很少有任何事情能跳入完全形成的生活。同时,有一些平行的轨道被证明是错误的方法-两者都是塞班在西方和IMODEe吨铝在日本。

今天,我认为增强现实*介于第二和第三点之间——我们已经看到了一些很棒的演示和第一批原型,并且我们没有大众市场的商业产品,但是我们很接近。

所以,微软正在运送全息照相机:它有很好的位置跟踪,将计算集成到耳机中,尽管是以体积为代价的,视野很小(比微软营销视频中建议的要小得多),而且要花3000美元。第二个版本计划用于,显然地,,二千零一十九苹果公司很明显正在做某事,通过公开招聘和收购以及CEO的评论(我怀疑关于小型化的工作,权力,收音机等等,苹果手表和AirPods都是相关的。谷歌可能还有别的东西,或者Facebook或者亚马逊。还有很多小公司和初创公司从事有趣的工作。

同时,魔力飞跃(一个16z的投资)正在自己工作,可穿戴技术,并且已经发布了一系列视频,展示这种设备已经具备的能力。我嵌入了以下内容之一:视频很酷,但是,正如观看iPhone的视频和使用iPhone的视频之间存在巨大差异一样,看AR视频和戴这个有很大的区别,四处走走,看到东西出现在你的眼前。我试过了,不太破旧。

\n“,“缩略图宽度:480,“被“解决”:YouTube,“商号”:YouTube,““版本”:1“,““解决”是的,““类型”:视频“,““AuthURL”:https://www.youtube.com/./UC2E1x3l45YUO2eOhRv-A7lw”,“提供者URL:https://www.youtube.com/”,“哈希德:NULL,“拇指指甲:https://i.ytimg.com/vi/kw0-JRa9n94/hqdefault.jpg”,“身高:480,“宽度“:854,“解析对象:视频“,“浮标:NULL,““描述”:结识害羞的办公室同事,浏览太阳能系统。你知道的,星期三。在10/14/15直接通过魔跳技术射击,不使用特效或合成。”}数据块类型="22““=”块yui_3_17_2_1_1491862484454_14828>

所以,前段时间我说看魔术飞跃是我看过iPhone以来最酷的一件事。

现在比那凉快多了。

_u 2014betway足球 Benedict Evans(@BenedictEvans) 3月16日,二千零一十七\n“}数据块类型="22““=”块yui_3_17_2_2_14918694548_62930>

所有这些意味着,如果我们今天处于“杰夫·韩”阶段,我们离iPhone 1阶段不远必威足球,然后,在接下来的十年左右,我们可以发展成一个真正的大众市场产品。

对于十亿人来说,那会是什么样子呢??

AR的第一个层次就是我们使用Google Glass所得到的——一个屏幕将东西漂浮在您面前的空间中,但它与世界没有任何联系。必威足球事实上,谷歌眼镜在概念上非常类似于智能手表,除了向上和向右看而不是向下和向左看。它给你一个新屏幕,但是它没有在你面前的世界的任何感觉。有了更先进的技术,虽然,我们可以扩展它,使您的整个视场成为一个可以显示窗口的球体,3D对象或其他任何东西,漂浮在空中

然而,人们可能称之为“真正的AR”,或者,也许是“混合现实”,设备开始对你的周围环境有所了解,可以把东西放在这个世界上,这样如果你停止怀疑,你可以想象它们真的在那里。不像谷歌眼镜,耳机将做你的周围环境的3D地图,并跟踪你的头部位置一直。这样就可以把一个“虚拟电视”放在墙上,让它在你四处走动时留在那里,或者把整个墙都陈列起来。人口稠密的(在咖啡桌上,用手举起或放下高山,就像你在模仿泥土一样。延伸,其他戴相同眼镜的人也可以看到同样的东西——你可以把墙壁或会议桌做成一个显示器,而你的整个团队可以立刻使用它,或者你和你的孩子可以在同一张明尼苏达木地图上玩上帝。或者那个小机器人可以躲在沙发后面,或者你可以把它藏在那里让你的孩子们找到。(这与VR的一些用例有一些重叠,当然,尤其是当人们谈到增加外部摄像机时。)这是作为屏幕的混合现实——或者也许,就像把你周围的世界变成无限的屏幕。

但是这里还有别的地方可以去,因为你还只是在做猛击-你在绘制房间的3D表面,但不能理解。现在,假设我在一个网络活动中遇到你,我看到你的LinkedIn个人资料卡在你头上,或者看到Salesforce的便条,告诉我你是一个关键的目标客户,或者Truecaller的便条说你打算卖给我保险然后走开。必威足球或者,正如《黑镜》所建议的,你可以阻止别人。就是说,“眼镜”中的图像传感器群不仅仅映射我周围的物体,还识别它们。这是真实的。增广现实-你不仅仅是展示与世界平行的东西,而是作为世界的一部分。你的眼镜可以显示你在智能手机或2000英寸屏幕上看到的东西,但是他们也可以把屏幕解开到现实世界中,改变它。所以,一方面,有一个光谱你可以充实(或)污染(通过把一切变成屏幕,整个世界,但另一方面,这可以让你把最微妙的线索或变化放入这个世界,而不只是在旅行时把每个手势翻译成你自己的语言,但是把“美式英语”改成英语。如果今天人们安装了铬延伸用“蛇人”代替“千禧年”,MR分机会改变什么?让你的老板来怎么样?呕吐彩虹?(有趣的是,毕竟,最重要的实际问题需要解决。)

你整天戴眼镜吗?虽然,一旦它们变得足够小?如果不是,许多更环境化的应用程序也不能正常工作。也许,有一个手表或电话的组合,这是“总是在线”的设备,必威足球以及你戴的眼镜,就像在正确的上下文中阅读的眼镜。这或许可以解决谷歌眼镜遇到的一些社会问题——拿起电话,看一块手表或者戴上一副眼镜,就会发出一个清晰的信号,人们可以理解,就像在酒吧里戴着谷歌眼镜一样。必威足球

这涉及到一个相关的问题——AR和VR是否合并?当然有可能,他们正在做与相关工程挑战相关的事情。在一个设备中同时执行两个操作的一个挑战是VR,让你进入另一个世界,需要清除其他所有内容,所以眼镜的边缘需要密封,其中AR不需要这个。并行地,AR的整个挑战是让世界穿越,同时遮挡你不想要的东西(而且在明亮的阳光下它可能不太好一段时间),VR希望从黑屏开始。戴着AR眼镜,你可以看到那个人的眼睛。在一二十年内,很多事情都是可能的,但就目前而言,这些技术轨道似乎有所不同。在20世纪90年代末,我们讨论了“移动互联网”设备是否会具有单独的无线电单元和屏幕,加上耳机,或者可能是键盘,或者是一个带键盘和屏幕的蛤蜊,我们在探索形状因素,直到2007年(或后来(在一块玻璃上分解)。VR和AR也可能在一段时间内被发现。

然后,你如何控制那些没有物质存在的事物并与之互动?VR的物理控制器是否足够?手部跟踪是否足够好(没有清晰的手指视图)?多用户智能手机意味着我们有直接的物理交互,这样我们就可以触摸屏幕上想要的东西,而不用把鼠标移开一两英尺,必威足球但是,我们会“触摸”在空中盘旋的AR物体吗?这是一个好的全天候界面模型吗?魔力飞跃当然可以创造一种深度感,这样你就可以相信你可以触摸东西,但是,您是否想要一个界面,使您的手滑动,虽然什么似乎是坚实的?我们是否应该改用语音-以及这多少限制了你能做什么(即使是完美的语音识别,想象一下,试图通过与电话或电脑通话来完全控制电话或电脑)?或者眼睛跟踪钥匙-如果眼镜进行虹膜跟踪,你看到你想要的东西并轻敲你的手表来选择它吗?当然,这些都是智能手机以及摆在他们面前的个人电脑必须解决的所有同类问题,就像2000年或1990年的形态因素一样,答案不明确,而且两者都没有,事实上,就是问题。

在我看来,虽然,你越是认为AR是把对象和数据放入你周围的世界,这越成为AI问题,就越成为物理接口问题。什么应该我走上前去看特别地?LinkedIn还是Tinder?我应该什么时候看到这条新消息——应该现在显示还是稍后显示?我是否站在餐厅外面说‘嘿,Four.,这有什么好处吗?或者设备的操作系统会自动这么做?这是如何被操作系统代理的,您添加的服务,还是云中单个的“Google Brain”?谷歌苹果微软和魔术飞跃可能对此有不同的哲学态度,但在我看来,如果想要它工作得很好,那么它必须是自动的,才能成为人工智能。如果一个人回忆起埃里克·雷蒙德(Eric Raymond)的一句话,电脑永远不应该问你应该能够解决的问题,然后是一台能看到你看到的所有东西并且知道你在看什么的计算机,还有,机器学习的未来十年的发展将建立在这个基础上,应该删除今天假设必须手动处理的所有问题。所以,当我们从桌面计算机的窗口/键盘/鼠标UI模型转向智能手机的触摸和直接交互时,一整层问题被移除了——抽象的层次改变了。智能手机不会问你在哪里保存照片,或者当你订购汽车的时候,你在哪里,或者使用哪个电子邮件应用程序,或者(使用指纹扫描仪)您的密码是什么-它消除了问题(以及选择)。AR应该是朝着同一个方向迈出的又一步:它比智能手机应用程序在小方形窗口中飘浮在你面前要多得多。快照不像Facebook的桌面网站那样工作,和环境,无形的,人工智能主导的UI将再次改变一切。

同时,AR眼镜越是试图了解你周围的世界(还有你自己),他们看的越多,以及向无数不同的云服务发送他们所看到的内容,根据上下文,用例和应用模型。这是张脸吗?你在和它说话吗?发送它(或者它的压缩摘要——是的,对于Salesforce来说,所有这一切都涉及很大的带宽,LinkedIn,TrueCallerFacebook和Tinder。一双鞋?Pinterest亚马逊和网络搬运工。或者,把一切都发给谷歌。如果在会议期间每个人都感到无聊,你把它记录到成功因素?这带来了一些非常明显的隐私和安全问题。我建议另一职位因为自主车一直捕获HD 3D 360度视频,一个充满它们的城市是最终的全景图。那么,如果每个人都戴着AR眼镜,那会发生什么呢?如果你被黑客攻击了怎么办?如果你连接的家庭被黑客入侵,你会有精神病患者,但是如果你的AR眼镜被破损,你会产生幻觉。

最后,一个非常重要的问题-有多少人会拥有这些之一?AR是否将成为移动电话用户子集的附件(比如,说,智能手表?或者巴西和印尼的每个小镇都会有卖几十种不同价格50美元的中国AR眼镜的商店吗?(到那时带宽会花费多少?)再一次,现在说还为时过早。但是从上世纪90年代末到2000年代初,另一个有用的论据是关于是否每个人都有同样的移动数据设备,或者有些人会拥有我们现在称之为智能手机的东西,但大多数人会拥有我们现在称之为“功能手机”的东西,在频谱上,一直到没有相机或彩色屏幕的简单设备必威足球。事后诸葛亮,这就像是在争论是否每个人都会有个人电脑,还是有些人会坚持使用文字处理器。规模和通用计算的逻辑意味着,首先PC机,然后智能手机成为目前仅有的50亿人拥有移动电话的单一通用设备,25亿至30亿人拥有智能手机,显然,其余绝大多数人将效仿。那么大多数人会坚持使用智能手机和一些(1亿部)吗?500米?10亿?(作为配件移到眼镜上,还是新的通用产品?对此的任何回答都是想象的飞跃,不分析。但是,1995年,人们曾说过,地球上的每个人都会有电话。

*什么?确切地,“增强现实”是什么意思?这个词经常用于像口袋妖怪围棋或者快照镜头(或者甚至是基于位置的博物馆音频指南)之类的东西。但这里我说的是戴一个装置遮住你的眼睛,你看穿,把东西放进现实世界——眼镜,实际上。“混合现实”这个词也在这里浮现,但是AR会这么做。