Meta CTO 万字采访:AR/VR的未来发展、技术选择、技术研究……
查看引用/信息源请点击:matthewball
Meta首席技术官安德鲁·博斯沃思的专访对话
作为早期布道者,马修·鲍尔(Matthew Ball)是最早思考元宇宙商业变革的人之一,并曾带来过热门书籍《元宇宙改变一切》。日前,马修·鲍尔分享了他与Meta首席技术官安德鲁·博斯沃思的专访对话,以下是具体的整理:
我在6月20日采访了安德鲁·博斯沃思。他于2006年加入Facebook,成为公司的第10位工程师,随后帮助创建了最初的News Feed、Messenger、Groups等功能,以及一系列的早期反滥用和基础设施系统。2017年,他成立并成为Reality Labs的负责人。2022年,博斯沃思成为Meta集团的首席技术官。
在采访中,我们讨论了Meta元宇宙战略的三个“时代”,VR/MR头显总销量每年突破1亿需要什么条件,他的梦想头显的规格,Meta对Reality Labs的支出,开发者是否可以和何时可以访问Quest的原始摄像头,光学AR眼镜需要的发明,以及人工智能的作用等等。
马修·鲍尔:我想从Meta对Reality Labs的愿景开始。你们在2014年收购了Oculus VR,收购价大约是前两年收购Instagram的两倍。到2019年,元宇宙业务每年的支出达到50亿美元。2020年,Quest首次亮相,Reality Labs正式成立,到第四季度,他们的年度支出超过100亿美元。然后在2021年,集团整体改名为Meta。这都是大家知道的事情。从你的角度来看,尤其是你2006年加入Facebook,2017年开始领导Reality Labs,到2022年成为Meta的首席技术官,我想知道公司里面发生了什么重大事件,而它们又是如何改变了你或公司对元宇宙的看法,什么原因促使你们大押元宇宙?
安德鲁·博斯沃思:最著名的其中一件事情是,马克(扎克伯格)做了一个演示,他们有一个早期版本的《Oculus Toybox》,他在这个VR体验中玩一个小型拳击游戏。当时的演示设备都是粗略的拼凑组装,那是Oculus时代的早期。在演示的最后,马克想把他的控制器放到桌面,但他没意识到桌面是虚拟的,所以组装的原型单元掉落在地上。这令大家相信它是一个重要的未来平台,你可以做到其他媒介所无法实现的事情。
我一开始并没有真正参与其中。那时候我还在Facebook的其他部门工作。在收购(Oculus)的时候,你可以想象,每次收购,你都会和对方一起制定一个目标路线图,以及公司希望在什么时间内完成什么目标。回顾过去,可以说他们当时有点乐观。他们对自己的能力,成本,上市时间,采用都非常乐观。我不知道这份文档是否有挖出来。我从来没有见过相关文档,我只知道它们在每一个维度上都至少有一个数量级的误差。
当我参与进来的时候,我认为马克依然非常坚信这项技术,但我认为他需要一份独立第三方的评估。我认为,实际上我给这件事带来的价值之一就是我一开始根本没有参与其中。我是一个在新领域学习速度很快的人,我打算给他一个独立第三方的视角。
所以我们进来了,我当时发现团队存在分裂。那时候,约翰·卡马克和许多人都致力于一体机头显的开发,将其价格拉低,减少玩家将设备接到昂贵PC的需求。(另一支)团队,亦即最初的Oculus领导团队,他们依然有一个非常清晰的愿景。对于这一点,我只能把它描述为一个外设,一个真正高端的外设,需要与PC或其他计算设备相接。通常,我们会将其称为PCVR。
坦率地说,马克收购Oculus或者成立Reality Labs并不是为了涉足外设业务。这种规模的业务无法像Facebook那样令一家公司保持足够长时间的兴趣。你会意识到你将在这场PC的生态系统之战中输掉。你不仅会输给Steam,而且会直接输给独立开发者。如果你只是接到这台机器,这台机器就是你所有体验的锚点。
实际上,我甚至不需要参与到战略层面,因为从产品的角度来看,我真的认为我们必须沿着一体机的路线走下去。你必须达到这样的形态,你必须摆脱缆线,摆脱一个昂贵,繁琐,很难构建的生态系统。所以我们确实对两者都追求。我们基本上同意Oculus Rift可以提供另一种产品,亦即后来的Rift S,我们与联想合作开发了这款产品。我们同意继续搞Gear VR,我当时很确信它的性能不够,但我们想测试看看,因为如果Gear VR足够好,你将有一个更低成本的途径来把VR变成主流。但它并不是我们需要的答案。不过,我认为我们在设备方面做得很好。我认为得到它的人都有很好的体验。所以在我看来,Gear VR为Quest铺平了道路。
Quest可以即时开玩,当你打开它时,你的VR之旅就开始了。在我们推出Quest 1之前(2019年5月),我们已经在研制Quest 2(2020年10月)。我们已经知道我们希望在第一代Quest中得到什么。所以我认为创始团队对最初的时代有着巨大的功劳,他们从无到有创造了一系列优秀的体验,特别是他们开创的体验,比如《 First Contact 》和《Toybox》,它们非常出色地讲述了关于这个媒介的故事。
(这个时代)则是要努力解决生产成本、市场成本、消费者接受度、内容战略等现实问题,而这将把你带向一条不同的道路,亦即这条一体机头显的道路。然后我们就会进入一切都将成型成态的时代。我想,在我的职业生涯结束时——我很幸运能拥有这样的职业生涯——我会带着极大的喜悦回顾Quest 2的发布,一年后以更低的价格推出一款更好的产品,这是一件非常特别的事情。这非常疯狂,真的非常疯狂,尤其是在消费电子产品的世界里。
所以我认为这对我来说是我们战略的展示。这就是我们的战略,这就是我们正在做的事情。但现在你在这个阶段。这个平台什么时候能够真正完善成型呢?我基本上认为第一个时代是带有PC的时代,这非常重要,如果没有它,你实际上无法到达我们现在的位置。然后是一段非常艰难的时期。
第二个时代是一体机时代,包括Quest 1和Quest 2。在我看来,这个时代会以Quest 3的发布而结束。Quet 3就像这个平台的样子。当然,你可以添加或不添加眼动追踪,你同时可以添加AI助手,或者可以不添加AI助手。你可以添加和删除所有这一切功能。它们都只是优化。但是,真正优秀的,全彩的混合现实能力是我们脑海中最后缺失的环节。顺便说一下,至少在我的脑海中,作为一个关键的组成,它会令使这个玩意成为主流,并解锁所有额外的用例。这就是我们现在的时代。
我无法向你描述在Quest 3发售后我们公司内部的感受,有很多积极的反响,你看到积极的势头,积极的销售,积极的采用。现在,一旦你知道这是你的基础平台,大量的软件工作就会发生变化,因为如果整个架构在下一代改变,你就浪费了之前的工作。现在你知道从功能的角度来看架构会是什么样子,你可以真正开始合并和组合一切,你可以加速发展,你的软件发展速度会大大提高。所以我认为我们现在处于一个有趣的混合现实时代。我们每次都给团队重新命名。之前的Oculus是VR,现在是MR。现在我们至少对未来几代有了一个真正清晰的愿景。当然,依然很难,依然令人兴奋,但我们感觉我们进入了一个新时代。
我们来谈谈这个新时代吧。个人电脑的年销量约为2.5亿台,最高时为3.5亿台。智能手机用户数量在15亿左右达到顶峰,现在约为12亿。你认为MR/VR头显年销量达到1亿的最大障碍是什么。
嗯,可能有三个答案,但我无法告诉你在我们看来这三个答案的优先顺序。
其中一个绝对是内容。有人会认为我的内容是指游戏。我不是这个意思。我是说‘有事可做’。我认为在这个领域确实存在领先于时代的硬件。就像Magic Leap一样,硬件并不是问题所在——硬件可能存在一定的问题——但这并不是导致核心挑战的原因,而是缺乏生态系统和可做的事情。这是其中之一。
在我看来,价格当然是一个原因。我认为(这两个答案)是相互关联的。显然,价格越低,你需要增加的价值就越低,但人们越不重视它。价格越高,你需要为它带来的价值就需要越大。
最后一个是,我称之为无障碍。这个词有点含混,我来解释一下我的意思。从舒适度到重量,再到晕动症,所有这一切,以及它对头发或妆容的影响,程度……需要充多少次电,多久充一次电。所有这一切,还有输入方法,需要两只手吗?你能单手操作吗?可以不用手吗?所有这一切限制了你可以在什么地方使用,可以使用多少次,有多少人可以使用。当然,它们存在权衡。如果你降低光学清晰度,你可以降低它的重量。
我们在所有方面都取得了进展,但这需要真正的创新。你之前提到了为这个领域投资的金额,当然,你已经发现我聪明地把“成本”这个词换成了“投资”。这就是我的看法。新技术的出现并不是与生俱来。供应链必须建立起来,制造厂线必须建立起来,技术本身必须发展起来。当然,这意味着你必须为你走过的10条错误道路付出代价,然后才能找到第11条行得通的道路。很明显,我们相信这项投资,我认为它将达到我们所说的数字,亦即未来将有数以亿计的人们能够接触到这种技术,并在个人和专业场景使用它们。尽管我对产品和平台的未来发展有清晰的愿景,但需要做的工作有很多。
你现在领导Reality Labs已有七年时间。再过7年,甚至10年,当你想到头戴式显示器时,你会想到什么?我指的是续航,分辨率,帧率,重量。你本能地会想到什么?不是说达到一亿的门槛,而是你真正认为你能得到并想要得到的是什么?
我们在Reality Labs做的一件有趣的事情是建造时间机器(“时间机器”是Meta常用来指代原型机的术语,它们的目标是帮助你“瞥见”未来科技,并不面向商业化,亦即它们暂时不会进入市场,只是作为演示)。
你可以看看如果我们把分辨率最大化了会怎么样?如果你只是追求绝对值,100%,你就忽略了其他一切,但你体验到了具体的效果,你对它就有了概念。你有视场,分辨率,颜色,深度,色域,你有不同的时间机器可以做,还有高动态范围,亮度等等。当我们研究这种体验时,我们一直在寻找的是参数化,所以他们会从全分辨率一直往回走,走到各条曲线可以汇交的地方。寻找是否存在价值函数开始趋于平稳的地方。
并不是说不会继续发展,不是说你不能继续看到相关方面的改进。所以当我展望七年后的未来,这可能是我所能确信看到的最远未来,我们考虑的是每度像素。你真的想要达到至少45个,这是文本显示非常清晰的数字。60实际上可能已经是视网膜分辨率的一半。你想要达到每度50到60像素的范围。40以上会开始变得很好。但我们已经在Varjo, Apple Vision Pro中看到,你可以看到今天你要付出多少代价才能得到那样的分辨率。你牺牲的是亮度和其他方面。这都是真实的权衡。
你想要有一个足够好的视场。如果你做得比Quest 3小得多,沉浸感就会降低。Quest 2稍微小一点,如果你比它再小一点,你就会开始注意到边缘。你的眼睛里有细胞可以检测运动的垂直变化。事实上,我认为对于沉浸感而言,更高的视场比更宽的视场更重要。当然,就信息密度而言,更宽的视场对我们而言更重要,因为我们的眼睛看到的更多是水平的。但垂直是令你相信自己沉浸在一个空间中的一种非常好的方式。
当然,你需要计算机来运行所有这一切。在我看来,设备必须是一体式的,没有线缆。我不想让别人看到我添加了一堆组件。我不是说它们没有用。你当然可以想象工业方面的应用。顺便说一句,关于PC和一体机的划分,有一个笑话是,我们现在实际上已经制造出了最好的、最流行的PC头显,但它实际上同时是一体机。你只需给它插线,或者使用Air Link。
所以对我来说,我认为舒适是其中非常重要的一点。你希望看重量下降,特别是,这不仅仅是原始的克数,这不是最重要的事情。平衡配重,光学堆栈离眼睛有多近。鼻子边缘到设备边缘,它控制着你鼻子的舒适度,你脸颊的舒适度,而你额头的压力大小取决于你用的是哪种头带。
这是Quest 3和Quest 2的一个非常大的变化。我希望到以后的重量能减少1到200克。另外,我认为音频非常不错。开放音频会带来限制,所以我们今天用的是耳机插孔。但随着时间的推移,我们可以给人们选择权。
帧速率。120Hz感觉很好。显然,对PC游戏要求240Hz或以上频率的玩家不会同意,他们喜欢这种平滑感,我对此予以尊重。在未来7年里,我非常怀疑我们是否会在这方面做出权衡……例如,视场的挑战之一是,视场边缘的像素比中心的像素多2倍。它们对你的二次价值要小得多。它们明显……它们是最不重要的像素。所以在有限的计算范围内,这是难以合理化扩大视场的原因之一。我对帧率的看法类似,我并不是说240帧不比120帧好。但在有限的计算预算中,你无法看到质的跃升。我认为注视点渲染有一个真正的承诺,它拥有解锁提高分辨率的能力。我们能想象这样一个世界吗:显示器有更高的帧率,但你要在系统的其他地方做出牺牲?再次强调,我不认为我们会为了专门优化它而牺牲其他方面。
顺便说一下,120Hz是一个非常受欢迎的功能。如果设备能够做到这一点,我们应该为想要这个功能的消费者解锁它。我们做到了。它一直非常受欢迎。我们确实想给消费者权限,给他们选择的权力。更多的灵活性是我们继续打造的元素之一,我真正希望的是在七年内,你有更多可以适应你的用例的头显可供选择。
如果你是一个游戏玩家,你可能已经习惯了华硕ROG 240 Hz的显示器,这非常酷,有没有类似的头显可以给你这样的体验?它会在其他地方做出牺牲,但可以做到你想要的帧率。因为在七年内我们依然无法摆脱重量,成本和性能等的基本权衡。我们实际上是从这三个中选择一个半,甚至不是选择二个。
苹果最近宣布,他们将允许开发者访问Apple Vision Pro的原始摄像头信息,但仅限于由企业账户管理的设备和通过企业系统分发的应用程序。对于在Quest设备提供任何或有选择地访问原始摄像头数据,Meta的看法是什么?有相关规划吗?你们如何考虑安全性和功能的权衡?
嗯,我当然希望人们能够尊重和理解这样一个事实,即我们在隐私问题方面比苹果走得更远。如果开发者可以直接访问摄像头,我们可以想象出非常有用的用例。你是一名机械师,你正在研究一个你不熟悉的引擎,开发者可以构建各种工具来帮助你看到叠加层,看到原理图,甚至诊断问题。如果无法访问,开发者就不能(预先)上传我们看到的每一个可能的图像配置。如果你不能自行测试并打造功能,这将是一个服务不足的用例。
同时,这项技术非常新颖,我们同时希望确保人们,旁观者,感到舒适,如果有人选择穿戴头显,例如在飞机,大家会知道这对他们意味着什么。现在我们正在寻找更多的技术来解决这个问题。有几种不同的方式可以向旁观者发出信号。我同时认为,消费者市场对技术越来越熟悉。我之前开了个关于苹果的小玩笑。我说,我认为Apple Vision Pro对我们整个行业来说都是非常好的。现在人们对这种设备有了更多的了解,了解得越多,人们就越不害怕,旁观者不会担心你使用头显,而你不会担心别人会对你戴上头显而有负面反应。
人们总是认为技术几乎只存在于业内。这并不公平。技术存在于社会情景之中。社会越舒适,你就越能自由地使用技术。社会环境越不舒适,在将技术推向市场时就越需要谨慎。因为如果你不小心,随着时间的推移,你可能会阻碍它的采用。所以我认为我们采取了相当保守的立场。我想每个人可能都明白我们为什么采取这种保守的立场。我认为在当时这样做是正确的。当然,与此同时,我们对混合现实的潜在应用感到兴奋,如果一个开发者得到了消费者的完全同意,并且周围的人能够予以理解,我们可以解锁这个功能。所以我们会继续关注消费者的舒适接受程度,以及随着这项技术的发展,它能够释放出什么样的力量。
苹果押下的一个大赌注似乎是EyeSight(Apple Vision Pro的外置显示屏,能够实时再现用户的眼睛),这或许反映了苹果自身的文化,或者可能是为了解决你之前谈到的问题。这对设备的成本、重量、电池消耗以及设备的一切都有巨大的影响。你认为这取舍值得吗?你喜欢这个功能吗?
如果我不提的话,我会有麻烦的。我们非常确定这是我们首先发明的。我的团队,Reality Labs Research曾在一次活动中进行了公开演示,而且我们有在Connect大会讨论过它,并进行了一次演示。我们搞这个技术已有一段时间。对我来说,成本,重量,价值的权衡并不存在。在我看来,看着那个人的眼睛并不是一种非常好的体验。
我同样不认为这对消费者而言是一个很好的成本效益交易,即便是拥有让人感觉舒适的设备的消费者都是如此。我认为,即便有了EyeSight,周围人与头显用户交谈时的感觉都不会有明显的改善。我不讨厌它。我认为只是一系列的设备在做出不同的选择和不同的权衡,而且能够看看大家对它的反应非常好。
我想谈谈更复杂的技术。我看到你和Meta的AR眼镜硬件主管曾说,真正的光学AR眼镜要成为主流,需要四到六种,甚至七种不同的NIT。
是的。
你能解释一下什么是NIT,以及你认为你们的愿景需要哪种NIT吗?
NTI是指New Technology Introduction,这是一个行业术语,亦即需要引入的新技术。如果你是产品团队,硬件产品团队,对于你们已经成功整合过的技术,你可以直接利用。这带来了很多舒适和(已知的)参数。你可以现场测试,你可以构建它。但新技术会增加了项目的风险。你不知道会不会成功。你不知道功能是否正确?性能是否正确?所以引入新技术增加了风险。
当你深入研究时,NTI真的有很多不同的种类。有的NTI会说,‘嘿,这是一种技术,但它以前从未在这个特定的领域出现过’。这是第一代的技术。在之前可能会存在相关的研究。我们有一个概念证明,我们知道它可以做到,但它从来没有产品化,小型化,没有以低成本,高效的方式完成。有时候你在实验室里做实验,你会想‘太好了,我们搞定了’。但问题是,是的,你确实搞成了,只是你用了100瓦,花了1000美元,而现在我需要你用100毫瓦和10美元的成本来实现。
当然,在那之前,这只是研究。从像CK(MetaAR眼镜硬件主管Caitlin Kalinowski凯特琳·卡利诺夫斯基)这样的人的角度来看,它们都是NTI。所以对我们来说,当考虑AR显示器时,你必须在一个非常非常小的空间里产生光子。如果你考虑的是消费类眼镜,你的空间只有这么大。
你必须非常有效地产生光子,因为你没有足够的电池。你必须能够产生非常明亮的光线,因为当你在外面走动时,你周围的世界可能有一百万比一的对比度,这取决于你所处的位置和阳光,诸如此类。至少是一万比一。所以你需要在合适的地方用亮度压倒日光。你必须保持热效率,因为它会产生非常多热量,这并不好,因为它就贴你的脸上。这都是巨大的挑战。
我们研发Micro LED已有很长时间。在Micro LED中,有的事情非常棘手,比如波长红色,红光,尤其是真正的红光,但即便是红色的光都很难产生。为什么?因为红色是一个很长的波长,而你只有一个非常非常小的地方来产生这个波长。所以你实际上是在尝试创造亚微米的镜子结构,让光在发射之前形成并保持足够长的时间。然后你需要以一种非常聚焦的方式发射它, 并以准直的方式发射。它不能到处都是,因为这不是一种高效的方式。一旦你有了这个光源,你需要把它变成各种颜色。当然,效率特性是不同的,所以你需要能够制造它。
然后,好吧,假设你有了这个光源,你需要把它和其他结合起来,把光送到你的眼睛,但你的眼睛是一个透镜,所以你不能让它只在一点照射你的眼睛。你必须进行光瞳复制。所以光线需要同时照射到你眼睛的几个地方,然后在视网膜重新聚焦成单一的图像。所以光瞳复制,顺便说一下,从效率的角度来看,这真的非常糟糕。你需要进行10次光瞳复制,由于光学扩展量定律,你把效率降低了1/10,因为每个像素,每个光子都需要走10条路径中的一条。
所以这是非常复杂的波导设计,它们有很多不同的方法来实现。它们都是利用光的全内反射原理。这个原理是说,当光线照射到一个相对于材料足够低的角度时,它会在路径上反射100%的能量。这就是光纤的工作原理。所以你想要一种有很高折射率的材料,因为折射率,两种材料的折射率之差决定了反射的程度。所以你需要材料有很高的折射率。材料的折射率越好,不仅它们能更有效地利用你产生的光,而且这对光瞳复制,对散热非常重要,而且你可以获得更广阔的视场。
你可以用玻璃,你可以用铌酸锂,碳化硅,你可以用新材料。所以现在我们有一个完整的材料研究小组,他们正尝试找出高折射率的材料。材料科学是其中很重要的一环。但即便你有了材料,你接下来必须设计波导,波导有很多不同的风格。你可以做表面浮雕光栅,你可以做体积光栅,你可以做全息光栅……我们有很多这样的光栅,它们有非常不同的权衡。有的很容易制造,有的很难制造。要想实现高质量的光学透视,你需要进行大量的研究。
所以,是什么控制着分辨率呢?其中一个是像素间距。所以你有了Micro LED,现在它们已经是两微米了。嗯,非常酷。然后你得再缩小一半。就像,天啊,这不是双倍的挑战。这是百倍的挑战。所以真的没有,我们对它的上限没有任何感觉。我认为这方面可以继续一辈子的研究。然而,我们确实认为我们正处于一个非常棒的时期,拥有了10年前或15年前所不可能实现的条件。我们只是尚未找到将它做成产品的途径。我们有一套AR眼镜,非常棒,超级棒。但它是一个研究工具,要做成产品,我们必须拿出一个关键的配方,亦即成本。
是的,没错,你必须做所有这一切,然后弄清楚如何以消费者能承受的合适价格来将它做成产品。我们正在取得巨大的进步。非常酷的是,作为一个行业,我们实际上都在采取非常不同的方法。苹果是DLP,谷歌和Raxium是量子点,我们则在研究Micro LED。所以在这个行业中有很多平行的路径,但它们实际上是非常不同的方法。这令人兴奋。因为这会增加行业成功的机会,所以在最后的某个时刻,我们会有一个非常好的,而且非常成本效益的版本。
我甚至没有谈到空间化音频,运行图形管道所需的定制芯片,以及有效完成这一切所需的无线连接。如果你认为点亮一个像素的成本非常高,试着通过无线电发送就更高了。这难以置信的昂贵组件都需要装进一个小小的装置里面。当然,这真的很令人兴奋,但同时可能是我们这个行业所面临的最大挑战,。
你谈到了以上不同的点。你谈到了在规划未来设备时所考虑的时间表,NIT,‘成本’和‘投资’之间的哲学差异。自2019年以来,Reality Labs已经花费了大约650亿美元。累计会计损失约为550亿美元。可以大概勾勒一下我我们已经看到的和我们尚未看到的技术吗?有多少是应用到我们尚没有机会接触的产品,有多少实际上是分配给5年或10年后的项目?
我可能无法给你更详细的细节。我可以告诉你的是,在如何分配(投资资金)方面,我一直遵循一个相当普遍的原则,亦即我一直希望以投资组合为基础进行投资。
人们忘记了我们在这段时间里所做的投资包括内容。内容是你的一项投资。无论是收购像《Beat Saber》背后的Beat Games这样才华横溢的团队,还是将自己的第二方生态系统带到游戏中,允许他们抢先体验,以换取他们开发新功能。或者只是向第三方开发者提供资金支持,帮助他们将自己的游戏带到VR,并确保他们对努力付出所获得的回报充满信心。
所以这是其中的一部分,这是你所感受到的。并不是说你对任何一款游戏都有信心,而是你相信为平台投资内容从长远来看是值得的。你正尝试引导一个双面生态系统。这就是我们公司的最终产品。最终的产品并不是一个硬件或一项技术,而是一个生态系统,一个双面的生态系统,每个人都在为这个生态系统做出贡献,而你在这个生态系统中占有一席之地。在这个生态系统中,你能够将消费者和开发者这两方面联系在一起。
如果你的投资组合中有太多是投资于未来,你很快就会脱离消费者真正想要的体验,脱离他们看重的体验。你当然可以给自己讲个故事,但这感觉非常冒险。所以你至少有一半都投入到相对更有形的事情上。这并不意味着它们现在就在市场上。它们甚至可以需要几年的时间。
现在,可能你有一个非常成熟的产品,可能你的投资组合可能超过50%,可能是80%都用于现在的或接近于现在的产品。可能你在一个小的,着眼于未来的投资组合中有一个增量部分。但那不是我们。很明显,我们的目标是长远的未来。但你再看看……对于外行人来说,这些数字听起来都很大。然后,如果你看看包括我们在内的公司在人工智能方面的投资,如果你看看大家的投资……比如说,他们愿意为类似iPhone或Android的产品做什么投资。我认为Android是一个很好的例子。Android,因为谷歌不收费,所以人们会想,哦,它的价值是零。但实际情况如何,你和我都非常清楚。
Android对谷歌的价值是巨大的,因为它给谷歌带来了非常高的地位,给谷歌提供了大量的信息,他们可以通过其他渠道为消费者提供服务。Android对他们来说是巨大的价值。你可以从他们每年支付给苹果的费用中看到获得这种地位的价值有多高。所以,数字是什么?每年200亿美元左右。所以当你看到这些数字时,你会说,好吧,你愿意花多少钱来控制自己的命运?我认为我们的支出都是量入为出的。我觉得我们在这方面做得很好。
最后一个问题关于。第一,我很想了解过去两年人工智能的进步是如何改变你们的发展路线图的?AI在元宇宙中的角色是什么?作为消费者、业余爱好者或开发者,是什么让你个人对人工智能感到兴奋呢?
人工智能对我们来说是一个非常令人愉快的发展。这是一个我们投入了很长时间的项目。我想你们都知道,Fundamental AI Research团队直到最近才开始向我汇报工作,我真的非常喜欢和这个团队一起工作。你可以想象,我依然和公司在这个领域所做的工作紧密相连。鉴于上一个答案,我谈到了我们在发展这项技术时所面临的巨大阻力。我们取得了很好的进展,但前方的挑战依然非常困难。人工智能是一股清新的空气。它的出现比预期要快得多,比预期要有用得多,它提供了一套切实可行的工具来改善我们尚未解决的困难问题。当你带着增强现实头显四处走动时,你是如何与设备交互呢?
你需要设备拥有一定的,因为没有更好的术语,我只能说‘常识’。它需要理解…我不需要教它每一件事情……我们永远都做不到。人类在这个世界的经验太丰富了。这就是自动驾驶汽车教给我们的事情。自动驾驶汽车,事实证明,你在交通中发现的随机条件的数量是如此之大,长尾是如此之长,你几乎无法真正实现。对于头显,我们总是在我们的架构图中有一个概念,这个agent能够感知到你的注意力和意图,知道你想要做什么并及时向你提供帮助。
所以如果我有一段文字出现在我面前,然后你走上前和我说话,它会感知到,并知道应该把文字移开,这样你就可以和你进行眼神交流。当你离开的时候,它可以把文字带回来,这感觉非常神奇。
我认为我们会做得更好。在混合现实中,你会想到Horizon,这是一个巨大的用户生成世界建筑结构。如果我回想一下早期,你说过有一个非常酷非常重要的备忘录……现在我要用备忘录这个词。就像我们用备忘录一样。杰森·鲁宾写了一个关于元宇宙的文件,当我第一次读到它的时候,我想我是第一个读到它的人。我当时想,这是一份开创性的文件。
所有这些想法都像是在水面上漂浮着,但它们并没有形成一个连贯一致的结构。我们在这方面犯了错误,我们在接下来的几年里放低了创造优秀体验所需的基础,遗憾的是,我们所能达到的高度同样很低。
它非常酷,任何人都能打造体验,但没有人能造出优秀的体验。我们在过去两年的Horizon开发中纠正了这个错误,并取得了巨大的成功。这对我们的平台和移动平台来说都是一个非常重要的时刻。但元宇宙这个想法是正确的。现在,人工智能完全改变了它。你有能力用简单的语言描述一个场景,并且迭代地这样做。它们尚不能在3D中做到这一点,更不用说4D动画。但我们正在进行这项研究,我们有一个团队在做,我们正在取得进展。这是一种非常令人兴奋的方式,可以降低进入门槛,允许人们去创造一个可以自豪地邀请别人参观的空间,或者是一个经常会使用的空间,因为它感觉真实,而且真的对他们有所反应。
我只是觉得,对我来说,AI在我们一直拥有的特定概念方面取得了飞速发展。在当时这是一个艰难的过程,一个漫长、缓慢、线性的过程,但突然间,我们看到了一条路径,比我们想象的要快得多。所以这是巨大的发展。然后是路线图,这都是软件概念,当然它会影响你的硬件。这款雷朋眼镜,它当然比第一代雷朋眼镜有了很大的改进,我们感到非常自豪。但人工智能,尤其是多模态人工智能已经真正揭示了它所能做到的事情。所以现在很明显,我们相信这种产品。我们正在制造它们,销售它们,我们对它们感到兴奋。不过,我们一直认为,它只是一个让人们习惯这种类型设备的垫脚石。
我认为它们比我们想象的要有用得多。这种情况多久发生一次?你做了一款消费电子设备,有一个有用的用例,它是一个强大的用例,可以推动销售,这是你在最终确定硬件时甚至没有想到的事情。你会觉得,根本不可能,这是天赐的礼物。这就是人工智能所带给我们的。从个人角度来看,我认为作为一个行业,有一件事情尚没有得到解决,但我们都非常兴奋:个性化人工智能。
今天我们都会取巧,对吧?我们用信息预加载上下文窗口,但这既昂贵又缓慢,如果你用这些信息填满它们,它们的内存就会变小。我认为我们尚未达到目标,这有很多原因,但我们都在朝着同一个方向努力。我认为个性化人工智能可以根据我的个人经历和沟通进行微调,以保护隐私和我们如何使用数据,我认为这是一件非常令人兴奋的事情。我认为这种能力对我来说非常有用,不是一般的有用,这将是一次巨大的飞跃。
报歉!评论已关闭!