为什么各国都在竞相以主权 AI 的名义建造 AI 工厂
现在 AI 已成为一项至关重要的技术,世界已被激烈的地理政治学斗争所吸引,因此“主权 AI”正在成为一个全国性问题也就不足为奇了。
想想吧。美国是否允许其为 AI 生成的数据在中国存储和处理?欧盟是否希望美国大型科技巨头访问其人民的数据?俄罗斯会信任北约国家管理其 AI 资源吗?国家会将其 AI 数据委托给以色列吗?
英伟达已拨款 1.1 亿美元,帮助各国培育 AI 初创公司投资主权 AI 基础设施,许多国家/地区正在自行投资 AI 基础设施。这是一些真正的资金,旨在推动世界拥抱 AI 的发展。问题就在于,这种讨论要不要大量的思想领导力来支持推销,或者各国是不是真的需要采用主权人工智能才能与世界别的地方竞争。这是一种对各国来说有意义的新型军备竞赛吗?
英伟达首席执行官黄仁勋在 2023 年 11 月的财报电话会议上指出,“主权人工智能”的崛起是英伟达 AI 芯片需求量开始上涨的一个原因。该公司指出,对国家计算机基础设施的投资是世界各国政府的新优先事项。
“主权 AI 云的数量确实相当可观,”黄仁勋在财报电话会议上表示。他说,Nvidia 希望让每家公司都能构建自己的定制 AI 模型。
其动机不单单是将一个国家的数据保存在当地的技术基础设施中以保护它。相反,他们看到了投资主权 AI 基础设施以支持经济稳步的增长和工业创新的必要性,Nvidia 首席财务官 Colette Kress 在财报电话会议上表示。
当时拜登政府限制向中国销售最强大的人工智能芯片,需要获得美国政府的许可才能发货。该许可要求仍然有效。
因此,据报道,中国开始尝试制造 AI 芯片以与 Nvidia 的芯片竞争。但不仅仅是中国。Kress 还表示,英伟达正在与印度政府及其大型科技公司(如 Infosys、Reliance 和 Tata)合作,以加强其“主权人工智能基础设施”。
与此同时,法国私有云提供商 Scaleway 正在投资区域 AI 云,以推动欧洲的 AI 进步,这是“新的经济当务之急”的一部分,Kress 说。她说,结果是未来几年的“数十亿美元机会”。
“你看到主权 AI 基础设施、人们、国家现在认识到他们必利用自己的数据、保留自己的数据、保持自己的文化、处理这一些数据并开发自己的 AI。你在印度看到了这一点,“黄仁勋说。
他补充说:“随着时下人们意识到他们无法承担将自己国家的知识、本国的文化出口给别人再将 AI 转售给他们的费用,主权 AI 云从世界各地涌现出来。
Nvidia 自己将主权 AI定义为“一个国家使用自己的基础设施、数据、劳动力和商业网络生产人工智能的能力”。
在 2024 年 2 月接受 VentureBeat 采访时,黄仁勋先生加倍强调了这个概念,他说:“我们现在有一种关于人工智能一代的新型数据中心,一个人工智能一代工厂。你也听过我把它描述成 AI 工厂。基本上,它采用原始材料,即数据,通过这一些 AI 超级计算机和 Nvidia 构件对其进行转换,并将它们转化为非常有价值的代币。这些代币是人们在 Midjourney 等令人惊叹的“生成式 AI 平台上体验到的”。
我问黄仁勋,如果无论数据在世界上的哪个位置都保持安全,为什么主权 AI 需要存在于任何特定国家的边界内。
他回答说,“没理由让别人来抓取你的互联网,拿走你的历史和数据。而且很多数据仍然被锁在图书馆里。在我们的例子中,它是国会图书馆。在其他情况下,国家图书馆。它们已经数字化了,但还没有被放到互联网上。
他补充说:“因此,人们开始意识到,他们必使用自己的数据来创建自己的 AI,并将他们的原材料转化为对自己国家有价值的东西。所以你会看到很多。几乎每个国家都会这样做。他们将构建基础设施。当然,基础设施是硬件。但他们不想使用 AI 导出数据。
英伟达已拨款 1.1 亿美元投资于 AI 初创公司,帮助开展主权 AI 项目和其他 AI 相关业务。
NVIDIA AI 国家全球负责人 Shilpa Kolhatkar 在斯坦福大学举行的美日创新研讨会上对主权 AI 进行了更深入的探讨。7 月的活动由北加利福尼亚日本协会和斯坦福大学美亚技术管理中心举办。
Kolhatkar 采访了加州大学伯克利分校哈斯商学院的讲师 Jon Metzler。那次对话的重点是如何通过投资 AI 技术来实现经济稳步的增长。Kolhatkar 指出,早在 ChatGPT 出现之前,Nvidia 就已经从一家图形公司转变为一家高性能计算和 AI 公司。
“今天,世界各地的许多政府都在研究怎么样抓住人工智能带来的这个机会,他们 [专注于] 人工智能的国内生产,”Kolhatkar 说。“我们有阿拉伯国家计划,它与各国今天实施的 AI 战略有点匹配。大约 60 到 70 个国家/地区制定了 AI 战略,围绕创建劳动力和拥有生态系统的主要支柱构建。但这也是围绕在政策框架内已拥有所有内容。
Nvidia 在建立生态系统和基础设施或超级计算机方面发挥着作用。她说,Nvidia 的大部分重点及其工程工作都集中在芯片之上的软件堆栈上。因此,Nvidia 已经更像是一家平台公司,而不是一家芯片公司。Metzler 要求 Kolhatkar 定义一个国家怎么样发展“AI 准备”。
Kolhatkar 说,一个概念是查看一个国家在原始 AI 计算、存储和与此类系统供电相关的能源方面有多少计算能力。它是否有熟练的劳动力来操作 AI?人们是否准备好利用 AI 的巨大民主化,以便知识传播到数据科学家之外?
当 ChatGPT-3.5 于 2022 年 11 月出现并生成式 AI 爆炸式增长时,它标志着 AI 终于以一种普通消费者可拿来自动化许多任务并查找新信息或自行创建图像等内容的方式工作。如果结果中存在错误,原因是数据模型没提供正确的信息。然后很快,不同的地区对什么是正确的信息有自己的看法。
“该模型主要在主数据集和西部 [地区] 的一组特定语言上进行训练,”Kolhatkar 说。“这就是为什么拥有主权的东西的国际化,即一个国家自己的语言、文化和细微差别,成为人类关注的焦点。”
她说,然后,各国开始开发生成式 AI 模型,以满足特定地区或特定国家的特殊性,并还有这一些数据的所有权。
“所有权是每个国家的数据和专有数据,他们意识到这一些数据和专有数据应该保留在境内,”她说。
Kolhatkar 表示,Nvidia 现在正在帮助各国以“AI 工厂”的形式创建此类主权基础设施。这与 100 多年前工业革命期间各国用工厂点燃的驱动力非常相似。
“工厂使用原材料进来,然后货物出来,这与国内 GDP 挂钩。现在的范式是,您最大的资产是您的数据。每个国家都有自己独特的语言和数据。这是进入 AI 工厂的原材料,它由算法组成,而算法又由模型组成,然后是智能,“她说。
现在,像日本这样的国家一定要考虑他们在为 AI 工厂准备好时是领先还是落后。Kolhatkar 表示,日本在投资、合作和研究方面处于领头羊,以创建一个成功的“人工智能国家”。
她说,为了经济或国家安全,公司和国家正在认真考虑应该将多少人工智能归类为“关键基础设施”。工业工厂可以在给定的城市创造数千个工作岗位,而现在数据中心也可以在给定的地区创造大量工作岗位。这些人工智能工厂就像几十年前的水坝和机场吗?
“你有点看一下物理制造的过去先例,看看 AI 工厂的乘数可能是什么,”Metzler 说。“将 AI 工厂视为公民基础设施的概念很有趣。”
Metzler 提出了 AI 竞赛中有几率发生的策略的概念。例如,他指出,也许较小的国家需要联手建立自己的更大的区域网络,以建立某一些程度的主权。
Kolhatkar 表示,例如,如果你的国家没有像三星这样的任何特定科技巨头的资源,这可能是有道理的。她指出,北欧国家正在相互合作,美国和日本等国家在 AI 研究方面也是如此。不同的行业或政府部门也可以聚在一起,在 AI 方面做合作。
如果 Nvidia 在这一点上站在一边,那就是传播技术,让每一个人都能掌握 AI 知识。Nvidia 有一所名为 Deep Learning Institute 的在线大学,用于自定进度的电子学习课程。它还有一个虚拟孵化器Nvidia Inception,已支持19,000 多家 AI 初创公司。
“Nvidia 真的相信 AI 的民主化,因为除非任何一个人都能够使用 AI,否则就无法充分的发挥 AI 的潜力,”Kolhatkar 说。
至于应对主权人工智能的后果,Metzler 指出,各国将不得已处理消耗多少电力的可持续性问题。
5 月,电力研究所(EPRI) 发布了一份白皮书,量化了 AI 电源需求的指数级增长潜力。他预计,到 2030 年,仅美国数据中心的数据中心总功耗就可能增加一倍以上,达到 166%。
他指出,每个 ChatGPT 请求可以消耗 2.9 瓦时的电量。这在某种程度上预示着 AI 查询所需的电力估计是传统 Google 查询的 10 倍,每个查询使用约 0.3 瓦时。这还不包括新兴的计算密集型功能,例如图像、音频和视频生成,这些功能没有可比的先例。
EPRI 研究了四种情况。在最高增长情景下,到 2030 年,数据中心的用电量可能上升到 403.9 TWh/年,比 2023 年的水平增长 166%。与此同时,低增长情景预计会增长 29% 至 196.3 TWh/年。
“这与能源效率有关,可持续性是每个人的首要考虑因素,”Kolhatkar 说。
Nvidia 正在努力使每一代 AI 芯片都更加节能,同时也使每一代 AI 芯片的性能更高。她还指出,该行业正在努力创造和使用可再次生产的能源。Nvidia 还以 Nvidia Omniverse 软件的形式使用其 AI 输出来创建数据中心的数字孪生。这些建筑物的架构可优先考虑能源消耗,并最好能够降低重复工作。
完成后,就可以在物理世界中构建虚拟设计,同时将效率低下的情况降至最低。Nvidia 甚至正在创建地球的数字孪生,以预测未来几十年的气候平均状态随时间的变化。人工智能技术还能应用于提高物理基础设施的效率,例如使印度的基础设施更能抵抗季风天气。通过这一些方式,Kolhatkar 认为 AI 可拿来“拯救世界”。
她补充说:“数据是一个国家拥有的最大资产。它拥有您的专有数据及您的语言、您的文化、您的价值观,您是拥有它并将其编纂成您想要用于分析的情报的最佳人选。这就是主权。那是在国内层面。对你的资产的本地控制,你最大的资产,[很重要]。
当然,计算机不分国界。如果您在世界各地架设互联网电缆,则信息流和单个数据中心理论上可以在全世界内提供其信息。如果该数据中心内置了安全层,则无需担心它的位置。这就是计算机创建“虚拟”基础设施的优势概念。
但是这些数据中心需要备份,因为全世界已经了解到,极端集中化不利于安全性和控制等事情。冰岛的火山喷发、日本的海啸、中国的地震、对基础设施的或任何特定国家/地区可能的政府间谍活动 — 这些都是拥有多个数据中心来存储数据的原因。
除了灾难备份之外,国家安全是促使每个国家/地区在其境内要求自己的计算基础设施的另一个原因。在生成式 AI 繁荣之前,出现了一场确保数据主权的运动,部分原因是一些科技巨头在去中介化用户及其开发个性化数据的应用程序方面做得太过分了。数据最佳实践产生了。
Roblox 首席执行官 Dave Baszucki 在 Roblox 开发者大会上表示,他的公司在全球运营着一个由 27 个数据中心组成的网络,以提供使其游戏平台在全球不同计算平台上运行所需的性能。Roblox 每天有 7950 万活跃用户,遍布世界各地。
鉴于世界各国政府都在制定数据安全和隐私法,Roblox 很可能不得不改变其数据中心基础设施,以便拥有更多在特定司法管辖区运营的数据中心。
世界上有 195 个民族国家,如果政策变得严格,一个企业在大多数情况下要拥有 195 个数据中心。并非所有这些划分都是狭隘的。例如,Kolhatkar 说,一些国家可能希望有意识地缩小富国和穷国之间的“数字鸿沟”。
推动 AI 去中心化的另一个因素——对隐私的需求。不仅对世界各国政府,而且对公司和个人也是如此。著名的 2024 年“AI PC”趋势为广大购买的人提供具有强大 AI 技术的个人电脑,以确保在家中操作 AI 的隐私。这样,科技巨头就不容易了解您要搜索的内容以及您用于训练自己的个人 AI 网络的数据。
黄建议各国根据自身的需求进行认知,以便利用当地习俗的知识构建大型语言模型 (LLM)。例如,切尔诺贝利在俄语中拼写为“e”。但在乌克兰,它被拼写为“切尔诺贝利”。这只是一个小例子,说明为什么特定国家/地区使用的系统要考虑当地的习俗和文化。
有些人担心这种趋势,因为它将世界推向更多的地理边界,而就计算而言,这真的不存在或不应该存在。
Geogrify 首席执行官、游戏行业地理政治学专家 Kate Edwards 在一条消息中表示:“我认为这是一个危险的术语,因为主权这个概念通常意味着一种权力动态,这种动态往往构成民族主义和更极端形式的民粹主义的基石。我明白为什么在这里使用这个词,但我认为我们想描述 AI 的方向是错误的。
她补充说,“主权是这个命名法的错误方向。它立即将AI的用途两极分化,并有效地将其与核武器和别的形式的大规模破坏归为同一社会工具类别。我不认为这是我们真正想要利用这种资源的方式,特别是因为它可能意味着一个国家政府本质上拥有一个被奴役的情报,其目的是加强和服务于维护特定国家主权的目标——这是绝大多数地理政治学冲突的基础。
各国是认认真真地对待 Nvidia 的评论,还是将其视为推销?Nvidia 并不是唯一一家成功推销的公司。
例如,Cerebras Systems 于 2023 年 7 月宣布,将向技术控股集团G42运送其巨型晶圆大小的 CPU,该集团正在阿拉伯联合酋长国建造世界上最大的人工智能训练超级计算机,名为Condor Galaxy。
Cerebras首席执行官 Andrew Feldman 在接受 VentureBeat 采访时表示,它从一个由 9 台互连的超级计算机组成的网络开始,旨在显着减少 AI 模型训练时间,总容量为 36 exaFLOP,这要归功于网络上的第一台 AI 超级计算机 Condor Galaxy 1 (CG-1),该计算机具有 4 个 exaFLOP 和 5400 万个内核。这些计算机位于美国,但由阿布扎比的公司操作。(这再次提出了一个问题,即主权 AI 技术是否必须位于使用计算能力的国家/地区)。
Cerebras 不是为其集中式处理单元 (CPU) 制造单独的芯片,而是采用整个硅晶圆并将其内核打印在比萨饼大小的晶圆上。这些晶圆相当于单个晶圆上有数百个芯片,每个晶圆上有许多内核。这就是他们在一台超级计算机中实现 5400 万个内核的方式。
费尔德曼说:“人工智能不仅仅是在吃美国,人工智能也在吃全世界。对计算的需求永不满足。模型正在激增。数据是新的黄金。这就是基础。