马斯克与黄仁勋至少有一个共识
发布日期:2022/10/13 10:11:46 访问次数:1086
一家企业声称本人是人工智能硬件与软件的指导者,它将完成五十年来最保守的计算架构革新。这句话出如今特斯拉往年 9 月 30 日召开的 Tesla AI Day 年度技术大会上,也可以用来描述英伟达在更早一周多召开的 GTC(GPU 技术大会)。辨别主导两家企业的马斯克和黄仁勋都是读书时移居美国并创业,如今各率领一家市值超越阿里巴巴的硬核科技企业。两人各 50 多岁,但仍然坚持对前沿技术的深层了解,能讲清楚细节。但类似到此爲止,马斯克过着巨星般的生活,多任妻子十多个孩子、上节目抽大麻、习气对一切宣布评论、擅长游说政策取得利益。黄仁勋公家生活低调,简直不宣布政治立场鲜明的评论,也简直不游说政府——自 1993 年成立至往年 6 月底,英伟达在美国的游说开支爲零。两家企业一度亲密协作,特斯拉造有自动驾驶功用的车,英伟达爲它提供处置器。黄仁勋买过多代特斯拉车,马斯克去 GTC 站过台。直到 2019 年,特斯拉宣布新车改用自行研发的自动驾驶芯片。明年,特斯拉也将逐步在数据中心采用本人的芯片交换英伟达商品。造车的企业开端造机器人,造游戏显卡的企业简直不在发布会上谈游戏。两家企业都将人工智能当作本人最中心的技术,对将来该是什麼样子也有相反的看法。这两家企业到目前爲止还没有间接的商业竞争,特斯拉的芯片、软件只用在本人的硬件上;英伟达则将芯片卖给其他企业,既不造车、也不造机器人。战争未必能继续,特斯拉明白表达了将本人的芯片以云计算提供应第三方的野心。PC 和智能手机时代的全球科技巨头,微软与苹果、Google 与苹果都曾有过无间协作,探究团体电脑和挪动互联网的终极形状,但将来方向明白后便转爲竞争,从商战一路走到诉讼。假如人工智能最终是下一代技术,特斯拉与英伟达走到这一步也没什麼奇异的。汽车企业、游戏芯片企业……科技企业最终都是 AI 企业马斯克:很多人以为我们只是一家汽车企业,但少数人不晓得,特斯拉称得上理想世界人工智能硬件和软件的指导者。黄仁勋:计算正以惊人速度开展。推进这枚火箭的引擎是减速计算,燃料是人工智能。往年 AI Day,特斯拉初次展现了测试中的人形机器人 Tesla Bot。相比去年由真人套上紧身衣装机器人的 PPT“亮相”,真实的 Tesla Bot 没有那麼多将来感,线缆暴露、双手举措迟缓、走起路来颤颤巍巍,临近的观众可以听到宏大的风扇响声。图:特斯拉的人形机器人,从概念到理想。Tesla Bot 不灵敏,波士顿动力的人形机器人五年前就能做后空翻。它的共同之处在于,Tesla Bot 就像是一辆行走的微型特斯拉汽车:胸前装载的 FSD(全自动驾驶)芯片——2019 年开端,每辆重生产的特斯拉汽车都有;传感器就是摄像头和麦克风,和特斯拉汽车用的也差不多。诸多软件和零件,都有互通。Tesla Bot 像人一样,可以做多种打工:浇花、搬零件、送快递,虽然如今任何举措都十分慢。以往工业机器人每个举措都需求工程师编程,机器才会动。Tesla Bot 则是像特斯拉自动驾驶零碎那样,用摄像头搜集数据、训练零碎,自主举动。特斯拉的工程师在发布会上说,机器人的训练都不必从头开端,“Autopilot(自动辅佐驾驶功用)上的计算机视觉神经网络”。不过车辆在一个立体里挪动。人走路、搬东西要复杂得多。图:特斯拉说人形机器人是有 28 个驱动器的汽车。Tesla Bot 的存在佐证了马斯克的话。特斯拉造车,但它最基本的是让计算机看懂外界环境、晓得如何自动运转的人工智能技术。爲了让人工智能算法更无效运作,特斯拉自 2019 年开端将车上的英伟达处置器换成本人研发的 FSD 芯片,训练算法的超级计算机明年会换成自研芯片 D1 搭建的 Dojo。如计算机迷信家艾伦·凯(Alan Kay)所说,“人要是对软件足够仔细,就应该本人造硬件。” 如今反过去也一样。往年 GTC,英伟达如期发布新的 RTX40 系列图形处置器耗电宏大、本钱也更高。黄仁勋解释说,由于 “摩尔定律曾经死了,芯片本钱会逐步降低的想法过时,计算是一个软件和芯片的成绩”。芯片的尺寸大致决议着芯片的本钱,而芯片里的晶体管数量又决议着功能。依据摩尔定律,随着制造技术更精密,同尺寸芯片里的晶体管数量每 18 个月翻倍。如今芯片的制程曾经小到 4 纳米,愈加迫近目前可以想象的极限。图:射击游戏画量变化,QUAKE(1996)vs COD: MW2(2022),左右滑动检查。作爲最早提出图形处置器(GPU)概念的企业,英伟达和老同伴台积电配合,跟着摩尔定律跑了 20 多年,让游戏画面极致逼真。走到止境之后,人工智能成爲协助提升效率的次要动力。黄仁勋从 2016 年就开端强调摩尔定律曾经难以爲继,本人开发人工智能算法提升芯片运转人工智能算法的效率,每年都有大幅提升。他称之爲 “超级摩尔定律”。比方英伟达这次发布的深度学习算法 DLSS 3,能依据游戏不同画面之间的光线、角度变化,自动丰厚画面细节,增加芯片的打工量,同时让游戏动画更逼真、流利。GTC 发布会后,黄仁勋承受科技剖析师本·汤普森(Ben Thompson)采访,描画了更依赖人工智能的虚拟世界。“将来更有意思的游戏会像 Minecraft 或许 Roblox。玩家本人在外面发明一个虚拟世界、改造这个虚拟世界。”Minecraft、Roblox 都是沙盒游戏,画面复杂,但玩家可以改动一切。假如想要以假乱真的画面体验,得看《赛伯朋克 2077》或许《使命呼唤》,但这样的游戏和拍电影一样:数百名美工人员、工程师绘制、调整游戏里的每个细节,确保游戏里的光影效果逼真,不违和。每团体走路的举措都得用上好莱坞拍片的静态捕获,这和拍一部电影没有太大区别,需求海量人力投入,研发本钱上亿美元。图:COD: MW 2020 制造画面,每个表情和举措都需求演员扮演。黄仁勋希望在虚拟空间里做到这样的画质,不需求每个步骤都有人干涉,而是让玩家本人改动一些。这需求:玩家可以完全发明一个拟真的世界、可以随意调整这个世界。在世界里完成完全自然的物理效果。比方不同物体掉落在地,会有完全不同的反响。游戏里有人工智能和玩家互动,比方玩家说 “建一座城堡”,人工智能会搭建一个美丽的城堡,供玩家改造。黄仁勋想象的每个条件,明天都有游戏能做到一局部,但没有一个能在三方面都做到极致。明天单个游戏开发本钱曾经可以超越 1 亿美元,最大的一项是人力。从打工室营建虚拟的游戏世界,到玩家的游戏机在屏幕上渲染逼真的画面,每个环节都将需求人工智能参与。这届 GTC,黄仁勋主讲的发布会将近 100 分钟。间接与游戏相关的内容只占不到 20 分钟,剩下的工夫都在展现英伟达的商品如何推进人工智能提高——比方新发布的自动驾驶芯片 Thor, 算力更强,支持更复杂的模型;新发布的 CV-CUDA 模型开源库,可以更快地处置图像义务, 如渲染、生成 3D 图像、视频引荐。2010 年,Google 人工智能迷信家尝试教神经网络辨认猫,动用了 1.6 万个 CPU,而英伟达只用 12 个 GPU 就到达了异样的效果。从那时起,可以并行处置义务的 GPU,成爲了人工智能范畴最重要的硬件,推着英伟达疾速崛起。如今英伟达的一半的业务与人工智能有关。AI 的希望在大模型,正好是这两家大企业的生意马斯克:假如你有几千万或几亿辆自动驾驶汽车,数量相当甚至更多的人形机器人,你会有规模最大的数据集。这些视频数据经过处置,汽车很有能够比人类司机更出色,人形机器人和人类难以区分。它们会具有通用人工智能的特征。黄仁勋:承受过少量人类知识训练的大型言语模型,能够是有史以来最大的软件时机之一。它是当今最重要的人工智能模型。它让我们有能够处理以前从未处理过的成绩。1990 年代开端,经济学家提出 “通用目的技术” (General Purpose Technologies)概念,以为通用的技术才干推进经济临时增长。比方轮子、青铜、铁、蒸汽机、内燃机或古代的计算机、互联网等等。人工智能是一个广泛、通用的技术,但到实践使用中并非如此。一团体工智能模型,通常只能处理一个义务。比方 2016 年打败围棋世界冠军的 AlphaGo,只会下围棋。如今训练好一个模型,略微调整就可以完成翻译、对话、阅读了解、续写内容、补充代码等数十种义务,表现比很多人好。比方 OpenAI 的 GPT-3,自动生成的文天性以假乱真。它们之间最分明的差距是训练模型运用的数据量。AlphaGo 只输出围棋对弈数据,规模数千万局。而 GPT-3 简直吞掉了互联网上大少数英文文本,从各种网页、旧事、食谱、图书到顺序代码等,整个英文维基百科,只占它训练数据全体的 0.6%。GPT-3 从这些数据中提炼规律和特征,将它们存到模型中,通常称爲 “参数”,等到新的数据输出模型后,它们决议输入什麼样的后果。GPT-3 有 1750 亿个参数,简直能处置大少数文本信息,需求它去处理特定的成绩,比方生成文本,只需求复杂训练。因而,有宏大参数的模型也被称爲根底模型(Foundation Models)。根底模型发扬出来的作用以及它能够的潜力,引发企业和机构争相入场,推着单个模型的参数破万亿。如今没有一个大模型,简直都不能说本人是个前沿科技企业。图:局部海内企业训练的根底模型规模。图片来自 MIT。更大的模型要用更多 GPU ,黄仁勋历来不吝啬对大模型的赞赏,从最重要的人工智能模型,到推进人工智能腾跃式开展,英伟达还和微软一同训练参数 5300 亿的大模型 “威震天”,和 GPT-3 相似,能当聊天机器人,可以阅读了解,翻译等。详细到业务上,英伟达去年跟阿斯利康协作,训练了一个研发新药的大模型;往年交付的处置器 H100 专门爲训练大模型优化,比上一代快 5 倍。这次 GTC 上,黄仁勋特意提到,新发布的自动驾驶芯片 Thor 会支持视觉 Transformer 架构——这是大模型的根底。特斯拉也将大模型用到了业务中。去年的 AI Day 上,特斯拉泄漏运用 Transformer 架构训练大模型,把特斯拉上八个摄像机的信息交融成 3D 环境,进步零碎看法四周环境的才能。特斯拉正在研发的超算 Dojo 也专门训练更大的模型做优化。特斯拉的 Autopilot 软件总监阿肖克·埃卢斯瓦米(Ashok Elluswamy)在往年的 AI Day 上说,“人们以为我们没法用摄像头检测深度,(其他物体)的速度和减速度,用大型数据集和大型模型能让它变得更精准”。往年 AI Day 后没几天,特斯拉宣布一些地域的 Model 3/Model Y 车型将不再搭载超声波雷达,只靠摄像头完成辅佐自动驾驶。技术将更普世,但需求有企业发明技术设备马斯克:人形机器人本钱能够不到 2 万美元。它的潜力令人难以相信,让人均消费力没无限制,意味着一个没有贫穷的将来,一团体们可以拥有任何本人想要的商品和效劳的将来。这是文明的基本转变。黄仁勋:人们以为,人工智能将在更少的企业中聚集技术力气,但现实上,人工智能使计算机迷信民主化。它使得任何人都可以编写软件,它使得每团体都成爲发明者,它将使得每团体都成爲游戏开发者。这一代人工智能技术推进从 Google 开端不是巧合。这家企业 1998 年开端做的事就是了解全世界的信息,让人无门槛地找到本人想要的信息。从一开端的文字,到图片、地图、视频、自动驾驶、围棋、病例、医学影像……Google 训练人工智能了解一项一项更复杂的事物。全球超越 20 亿用户提供了无量无尽的数据,帮 Google 训练。这个进程里 Google 展现了有数广告,成爲全球支出和利润都最高的互联网企业,因而有钱持续投入人工智能技术研发。这因而惹起了关于巨头垄断人工智能技术的担忧。大少数企业没有这样可以支持人工智能数据搜集和研发的完满商业形式,得找新的途径。2015 年,马斯克与时任硅谷孵化器 YC 的总裁山姆·阿尔特曼(Sam Altman)等人出资 10 亿美元兴办了非营利机构 OpenAI,对标 Google 旗下的 DeepMind,研讨敌对的、开放的人工智能,称将与世界分享技术。投资方多有本人的企业,特斯拉、YC(在数百家创业企业持股)、LinkedIn、微软等,没有 Google、Facebook 那麼多的数据,但也需求人工智能。2018 年终,马斯克加入 OpenAI 董事会,理由是跟特斯拉正在做的人工智能研讨抵触。事先特斯拉曾经开端消费 Model 3,当年就成爲销量最高的电动车型。完满的自动驾驶商业形式成型:到如今,特斯拉一共卖出 300 多万辆车,大局部是 Model 3,其中 16 万辆车启用了 FSD(完全自动驾驶才能)、更多车辆启用了 Autopilot(自动驾驶辅佐零碎)。这些车主给特斯拉付钱都在协助特斯拉积聚数据训练算法、收费当测试平安员,财力雄厚的 Google 也只要大约 1000 台无人驾驶测试车。积聚数据、训练算法的同时,特斯拉也成爲了一家年产过百万辆的车企,且车型极少。到 2022 年底,特斯拉的年化产能估计将打破 200 万辆。产能决议本钱,而 Tesla Bot 复用了特斯拉汽车的相当一局部零件和技术。Tesla Bot 的大脑用了爲汽车设计的 FSD 计算机和视觉神经网络。电池的管理芯片和零碎,也和车用的一样。特斯拉汽车碰撞测试中的模仿剖析软件、力学剖析模型等都用到了机器人上,尽能够增加反复研发。马斯克说特斯拉如今的目的是 “以最快的速度消费出有用的人形机器人”,有点用、少量用塑料造,尽量廉价——不需求完满,让更多的人情愿付钱购置就行。这是特斯拉的人工智能研发途径,开发、大规模部署有自动驾驶技术的汽车,降低本钱、让更多人购置,于是数据更多、算法更聪明、卖得更多更廉价,于是人工智能技术能被更多人用上。英伟达则是压低技术的运用门槛。黄仁勋以为,计算机协助社会的水平,限制不在本钱,而是有多少人会编写计算机顺序。英伟达的显卡合适训练人工智能模型,但有门槛——它是爲处置图形设计的,想用它训练神经网络,顺序员得学习 OpenGL 等图形编程言语。借助英伟达的软件平台 CUDA,不会图形编程的顺序员,也能用本人擅长的编程言语,无妨碍调用 GPU 疾速训练算法。英伟达卖了更多 GPU,也让更多人有了训练人工智能的才能。这异样改动了英伟达,如今它 80% 的员工从事软件打工。这次 GTC 上,英伟达更新的虚拟环境发明引擎 Omniverse 是压低门槛的另一个工具。在黄仁勋的想象中,Omniverse 是一个大型的虚拟世界数据库,外面的一切元素,不管是螺丝还是树木,只需求建造一次,然后共享给每一个需求运用的人。在 GTC 后承受媒体采访时,黄仁勋描画了它的将来,“说给我一片陆地。给我一条河 ...... 你想描绘什麼就描绘什麼,人工智能就会在你面前分解出 3D 世界。然后你可以修正它。”黄仁勋希望 Omniverse 成爲新技术的根底设备。特斯拉正在研发的超算 Doji 将会成爲它首个根底设备效劳。马斯克说,将来神经网络越来越多,让人更省钱地训练模型,是运营 Doji 最无效的方式。过来十年,人工智能研讨从学院主导变为商业企业主导。自动驾驶热、AlphaGo 赢过围棋冠军,一工夫,中美的互联网、科技大企业快抢光了大学里研讨人工智能的博士生——这在事先,是一家企业做人工智能的门槛。如今没那麼难。简化编程难度的开源软件包、更合适运算的处置器。写 AI 顺序、调参数的不再需求博士,能用到相关技术的也不只是大企业。人工智能迷信家、Google AI 担任人杰夫·迪恩(Jeffrey Dean)因而将过来十年称爲这个行业的黄金时代。就像计算机、互联网等技术阅历过的那样。大大小小的研讨机构、商业企业一层一层搭建根底设备,当他们垒起的基石足够高,影响更大的改动就能够发作。