本文转载自 The New Stack。
图片来源:由 alphaspirit.it 在 Shutterstock 上发布
AI 网关是 AI 基础设施领域的新热点。这些系统将成为关键缓冲区,是 AI 应用与外部用户及内部 AI 建模团队之间的安全防护和负载均衡层。采用 AI 网关的紧迫性显而易见。
随着大型语言模型 (LLM)、高级计算机视觉算法及其他机器学习技术成为应用的重要组成部分,其集成和管理挑战也日益严峻。AI 网关为这些复杂挑战提供了一个新型解决方案,这也为 AI 工作负载提供了一个集中控制点。
但令人困惑的是,许多 AI 网关提供商并不采用“AI 网关”的说法,而是将它们描述为 AI 开发人员门户、AI 防火墙、AI 安全防护或 AI 负载均衡 —— 所有这些都包含 AI 网关的元素。
不出所料,AI 网关经常被拿来与 API 网关进行比较。管理 API 是 AI 网关的关键一环,这些网关通常被设计用来与大型云或 OpenAI 等外部 AI 提供商进行交互。(事实上,一些公司所谓的 AI 网关产品均基于 API 网关进行构建,只是添加了一些针对 AI 而微调的插件)。
因此,要正确设计可满足现代应用设计和部署要求的 AI 应用基础设施,必须了解 API 网关与 AI 网关之间的区别。
API 网关充当客户端与后端服务之间的中介,可帮助应用开发人员、安全团队及 DevOps 或 Platform Ops 团队减少在应用前管理和部署 API 的复杂性。API 网关还可以充当安全防护和负载均衡层,既能确保企业的 API 安全,又能保护企业的外部 API 免遭攻击者利用。
API 网关的主要功能包括:
如今,大多数企业都通过第三方 API(来自 OpenAI、Hugging Face 或超大规模云服务商)来使用 AI。实际构建、调整和托管各自模型的企业也可通过内部 API 使用它们。AI 网关的基本作用是支持应用开发人员、AI 数据工程师及运维团队轻松地快速调用 AI API,并将其连接到自己的应用。AI 网关的工作原理类似于 API 网关。
但两者之间也有着显著区别。例如,在计算要求方面,AI 应用与传统应用截然不同,并需要使用不同的硬件。训练 AI 模型、微调 AI 模型、为其添加其他专业数据以及查询 AI 模型等每项作业可能有着不同的性能、延迟或带宽要求。
由于深度学习固有的并行性或推理的实时响应要求,可能需要不同的方法来分配 AI 工作负载。要衡量 AI 系统的消耗量,还需要对令牌和模型效率有深入理解。
AI 网关将监控入站提示,以发现滥用迹象,如提示注入或模型盗窃。简而言之,虽然 API 网关对于传统应用而言必不可少,但在处理 AI 特定流量模式和要求时,可能力不能及,例如:
舍鱼而取熊掌往往会带来风险和挑战。有些企业干脆选择只使用单个 AI 服务并管理其单服务 API,以避免出现问题。但此举可能会引发 AI 锁定风险,也会对希望在其 AI 服务中使用定制功能的团队造成影响。所以在决定试用 AI 网关之前,请考虑以下几点:
需要说明的一点是,AI 网关是相对较新的技术,在短期内可能会有很大发展。但切勿幻想它能够适用于任何情形。一些 AI 应用能够与传统 API 网关完美搭配。
例如,如果应用主要通过 OpenAI API 使用,并且没有进行大量调整或额外训练,那么其应用的要求可能与传统应用非常相似。在这种情况下,可能会适得其反,增加 AI 网关成本并加大运维复杂性。
实际上,AI 应用的部署模式很可能兼有 API 网关和 AI 网关,因为这两种用例通常共存,甚至相辅相成。
目前,AI 网关功能不仅已经添加到现有 API 网关产品中,而且 AI 团队还部署了 NGINX 反向代理和 Ingress controller(Ingress 控制器),从而为 AI 应用(包括训练和推理)提供一些治理、负载均衡和交付功能。
未来,AI 网关将以多种形式和规模出现在现有 API 网关产品中,或作为独立套件使用。实际上,AI 网关是 API 网关在新 AI 时代演进的必然结果,正如 API 网关是从反向代理演变而来一样。
了解了这两类网关之间的区别,就能理解为何二者均必不可少以及明白应如何使用它们——即使它们作为相关或相依的应用或微服务并存。
"This blog post may reference products that are no longer available and/or no longer supported. For the most current information about available F5 NGINX products and solutions, explore our NGINX product family. NGINX is now part of F5. All previous NGINX.com links will redirect to similar NGINX content on F5.com."