Higress 是一款基于 Envoy 和 Istio 构建的 AI原生、高性能 API网关,由阿里巴巴开源并捐赠给云原生计算基金会(CNCF),于 2026 年 3 月 15 日正式成为 CNCF Sandbox 项目。它将流量网关、微服务网关、安全网关与 AI网关统一于单一控制面,为云原生和 AI 工作负载提供标准化的流量入口。
目前,Higress 已形成三大核心产品矩阵:
- API网关(https://higress.ai/api-gateway):将流量网关、微服务网关和安全网关三合一,提供统一的服务暴露、流量管控与 API 全生命周期管理。
- AI网关(https://higress.ai/ai-gateway):专为 AI 场景设计,统一代理大模型 API 与 MCP Server,支持模型、工具(MCP)及 AI Agent 的集中接入与管理。
- HiMarket(https://higress.ai/himarket):助力企业构建 Agent、Model、MCP 市场,提供统一的 AI 能力管理平台。
Higress 诞生于阿里巴巴内部的大规模生产实践,旨在解决 Tengine 重载影响长连接服务以及 gRPC/Dubbo 负载均衡能力不足等问题。目前,其企业级用户已覆盖阿里巴巴集团、蚂蚁集团、携程、大疆创新、国泰产险、唯品会、Boss直聘、快手、Sealos 等,横跨互联网、金融、旅游出行、硬件、娱乐、创新企业等多个行业。
为何需要 AI网关:与传统 API网关的区别
在深入 Higress 之前,有必要理解 AI网关与传统 API网关的本质区别。
传统 API网关主要用于管理常规的 HTTP/RPC 流量,核心能力包括路由转发、认证鉴权、限流熔断和可观测性。然而,大语言模型(LLM)的流量特征与传统 API 存在显著差异:
| 维度 | 传统 API网关 | AI网关 |
|---|---|---|
| 计费与限流维度 | 按请求次数(QPS)限流 | 按 Token 数量限流,成本控制维度更细 |
| 后端多样性 | 相对固定的服务发现 | 多模型供应商(OpenAI、Anthropic、Google、千问、文心等)并存,需统一协议转换 |
| 响应特性 | 普通 HTTP 响应 | LLM 流式响应(SSE/Streaming),网关需支持流式处理 |
| 缓存策略 | 常规精确缓存 | 支持语义缓存,相似问题可复用推理结果 |
| 智能路由 | 基于权重的负载均衡 | 支持模型感知路由与智能负载均衡 |
传统网关在面对 AI 场景时往往力不从心,AI网关应运而生——其核心定位是作为 AI 流量的标准入口,提供统一的多模型代理、Token 级治理和 AI 特定的安全管控。
具体而言,Higress AI网关提供四大核心 AI 场景能力:
- 多模型代理:支持 100+ 主流模型的统一协议转换,支持模型级 Fallback,后端模型调度更加灵活。
- 应用防护:对输入到外部模型的数据进行隐私保护,对输出内容进行过滤,保障数据安全。
- AI 缓存:支持精确缓存及语义缓存,对相似/重复问题节省 Token、降低时延。
- Token 管控:追踪 Token 使用量,对超额消费进行限制,为 AI 应用的额度管理提供数据支持。
快速上手指南
Higress 提供了多种部署方式,最便捷的是通过 Docker 一键启动,适合个人开发者学习和本地测试。
1 Docker 快速部署
# 创建工作目录
mkdir higress; cd higress
# 启动 Higress(配置文件自动写入工作目录)
docker run -d --rm --name higress-ai -v ${PWD}:/data \
-p 8001:8001 -p 8080:8080 -p 8443:8443 \
higress-registry.cn-hangzhou.cr.aliyuncs.com/higress/all-in-one:latest
端口说明:
- 8001:Higress UI 控制台入口
- 8080:网关 HTTP 协议入口
- 8443:网关 HTTPS 协议入口
所有 Docker 镜像均使用 Higress 自有镜像仓库,不受 Docker Hub 限速影响,且镜像提交和更新经过阿里云 ACR 安全扫描机制保护,生产环境使用同样安全可靠。若在海外拉取镜像超时,可替换为对应区域的镜像源:北美 higress-registry.us-west-1.cr.aliyuncs.com,东南亚 higress-registry.ap-southeast-7.cr.aliyuncs.com。
2 Kubernetes 部署(生产环境推荐)
对于生产环境,推荐使用 Helm 进行 Kubernetes 部署:
# 添加 Helm 仓库 helm repo add higress.io https://higress.io/helm-charts helm repo update # 创建命名空间 kubectl create namespace higress-system # 安装 Higress helm install higress -n higress-system higress.io/higress
验证部署状态:
# 查看 Pod 运行状态
kubectl get pods -n higress-system
# 获取控制台访问地址
EXTERNAL_IP=$(kubectl get svc -n higress-system higress-controller -o jsonpath='{.status.loadBalancer.ingress[0].ip}')
echo "访问地址:http://${EXTERNAL_IP}:8001"
生产环境资源配置建议:
- 网关副本数:2-3 个(高可用推荐 3 个)
- CPU 请求:1-2 核心
- 内存请求:2-4 GB
- Controller 副本数:2 个
3 验证部署与访问控制台
部署完成后,访问 http://localhost:8001(或对应的 K8s Service 地址)即可进入 Higress Web 控制台。控制台提供开箱即用的图形化界面,可进行路由配置、插件管理、可观测性查看等操作。
核心功能亮点
1 AI网关:统一多模型代理
Higress 支持统一代理国内外所有主流模型供应商,包括 OpenAI、智谱、千问、文心等,通过统一的 Model API 调用不同大模型,使得后端模型调度更加灵活。企业可通过 AI网关集中管理所有 LLM API 服务接口,并在网关层实现:
- 统一协议转换:不同模型供应商的 API 协议各不相同,Higress 自动完成协议适配
- 多模型负载均衡:根据配置策略将请求分发到不同模型
- 模型级 Fallback:主模型不可用时自动降级到备用模型,保证高可用
- Token 级限流:基于 Token 使用量进行精细化配额管理
2 MCP Server 托管
Higress 通过插件机制支持托管 MCP(Model Context Protocol)Server,使 AI Agent 能够轻松调用各类工具和服务。通过 openapi-to-mcp 工具,可将 OpenAPI 规范快速转换为远程 MCP Server 进行托管。
托管 MCP Server 的核心优势包括:统一的认证授权机制、精细化的限流防滥用、全面的工具调用审计日志、丰富的可观测性监控,以及通过插件机制实现的动态更新(无需中断或断开连接)。
3 全新 Gateway API 与 Inference Extension 支持
在最新发布的 v2.2.0 版本中,Higress 实现了对 Gateway API 及 Inference Extension 的全新版本主要特性适配。这意味着:
- Higress 可作为成熟的 Kubernetes Ingress Controller,兼容主流 Nginx Ingress 注解
- 支持用户使用新版 Gateway API 配置网络路由,拥抱新一代 Kubernetes 服务网络标准
- 原生支持 AI 推理流量的治理,包括模型感知路由与智能负载均衡
- 在 Ingress Nginx 于 2026 年 3 月正式退役的背景下,Higress 提供了安全、即插即用的替代方案
4 Dify 官方插件集成
2026 年 4 月,Higress 官方推出了 Dify 模型代理插件,已正式上架 Dify 插件市场。用户在 Dify 插件市场搜索 Higress 即可获取并安装,配置网关路由和鉴权后,即可经网关访问文本生成、图片生成、向量嵌入、文本排序等模型服务。
该插件支持文本生成(OpenAI 兼容协议,支持思考模式、工具调用、流式调用、结构化输出)、图片生成(阿里云百炼)、向量嵌入(OpenAI 兼容)和文本排序(阿里云百炼),并支持 API Key 和 HMAC(AK/SK)两种鉴权方式。
5 强大的扩展能力:Wasm 插件生态
Higress 基于 Envoy 构建,支持通过 WebAssembly(Wasm)插件进行能力扩展,可使用 Go、Rust、JavaScript 等语言编写插件。这种扩展架构具有“即插即用、按需加载、安全隔离”的特点,每个扩展独立部署和升级,不会影响网关核心功能。
五、生态整合与社区动态
1 加入 CNCF
Higress 于 2026 年 3 月 15 日正式加入 CNCF,成为 Sandbox 级别项目。加入 CNCF 意味着 Higress 能够与 Kubernetes、Envoy、Istio 等顶级云原生项目更深度地协作,共同定义技术标准;同时依托 CNCF 的中立治理框架,吸引更多来自不同组织的贡献者,避免项目发展受单一厂商意志影响。
2 官网重构:AI 友好设计
2026 年 1 月,Higress 官网迎来全面升级,采用 Astro 5 + Starlight 技术栈,接入 llms.txt 标准,支持 Cursor、Claude Code 等主流 AI Coding 工具,使 AI 能够更高效地读取和理解文档内容,辅助开发者编写接入代码。
六、总结与建议
1 Higress 的核心定位
Higress 的核心价值在于将 AI网关、API网关与微服务网关统一于单一平台,解决了企业在云原生和 AI 转型中面临的“多套网关并存”的运维困境。对于正在从 Nginx Ingress 迁移的用户,Higress 提供了平滑的替代路径——兼容主流 Ingress 语义与常用 Nginx 注解,覆盖重写、限流、鉴权、TLS 等能力,并支持灰度切流、流量镜像与一键回滚。
2 适用场景与选型建议
Higress 特别适合以下场景:
- 已在 Kubernetes 上运行微服务,寻求与云原生生态深度集成的团队
- 需要同时管理传统 API 流量和 AI 模型流量的企业
- 希望构建统一 AI 中台,集中管理多模型调用和 Token 配额的组织
- 正在从 Ingress Nginx 迁移,需要平滑过渡方案的 Kubernetes 用户
3 未来发展建议
- 积极参与社区:Higress 已加入 CNCF,用户可通过 GitHub Issues、微信群(添加微信号
nomadao)等渠道参与社区讨论和贡献。 - 充分利用插件生态:Wasm 插件机制为业务定制提供了强大灵活性,建议有定制需求的团队学习 Wasm 插件开发。
- 关注企业版:如需 99.99% 网关高可用保障和企业级技术支持,可考虑阿里云云原生 API网关(商业版)。
- MCP 托管能力值得探索:随着 AI Agent 的普及,MCP Server 托管将成为 AI 基础设施的关键能力,Higress 在此方向布局较早,值得持续关注。
最新动态
- 路线图 (Roadmap):根据规划,未来版本将进一步强化 AI 能力。例如,v2.3.0 版本计划支持通过 AI Agent 对 Higress 进行原生运维,并支持 WebRTC 协议以应对实时 AI 场景。
- 社区生态:Higress 已衍生出 HiMarket 等子项目,帮助企业构建统一的 AI 能力管理平台。此外,社区还积极参与了"开源之夏"等活动,推动项目发展。
相关资源
数据统计
数据评估
关于Higress AI网关特别声明
本站微企脉提供的Higress AI网关都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由微企脉实际控制,在2026年4月20日 下午11:31收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,微企脉不承担任何责任。
相关导航
DNSPod是国内提供智能DNS产品的网站,致力于为各类网站提供高质量的电信、网通、教育网双线或者三线智能DNS免费解析。目前DNSPod已经是国内最大的免费DNS解析产品提供商
uView Pro跨平台UI框架
uView Pro是一个专为uni-app开发生态打造的高质量UI框架,旨在帮助开发者使用Vue3和TypeScript高效构建跨平台应用。它旨在帮助开发者通过一套代码,快速构建运行于鸿蒙、Android、iOS、H5及各类小程序的应用程序。
OpenTiny NEXT
OpenTiny NEXT是华为开源的OpenTiny项目推出的下一代企业级前端智能开发解决方案。
Uiverse UI设计元素库
Uiverse 最大的开源免费的UI设计用户界面元素库
堡塔多机管理
堡塔多机管理,一站式管理宝塔面板、SSH终端、远程桌面。
Its Hover开源动画图标库
Its Hover 是一款基于 React 和 motion/react 构建的开源动画图标库,其核心理念是 “为意图而动的图标” (Icons that move with intent)。与传统静态图标集不同,Its Hover 将动效视为图标设计的一等公民,每个图标在悬停时都会产生有目的性的动画,为用户提供清晰的交互反馈,而非仅为视觉点缀。
宝塔面板
宝塔面板,让运维简单高效。面板支持Linux与Windows系统。一键配置:LAMP/LNMP、网站、数据库、FTP、SSL,通过Web端轻松管理服务器。
JSON格式化在线解析工具
JSON解析格式化在线工具
TRAE
TRAE AI IDE 国内首款 AI 原生集成开发环境,深度集成 Doubao-1.5-pro 与 DeepSeek 模型,支持中文自然语言一键生成完整代码框架,实时预览前端效果并智能修复 BUG。
daisyUI组件库
daisyUI是一个基于 Tailwind CSS 的流行组件库官网。它的核心理念是通过提供语义化、可复用的组件类名(如 btn、card、toggle),来解决原生 Tailwind CSS 开发中需要编写大量工具类(utility classes)的痛点,从而让前端开发“更快、更简洁、更轻松”。
Ui-Layouts开源前端组件库
ui-layouts.com 是一个为现代网页开发者与设计师打造的开源工具箱和React组件库。它不仅仅是一个简单的代码集合,更是一个旨在加速构建具备创意动效和统一设计感网站的“前端宇宙”。
Vue.js中文官网
Vue.js中文官网是渐进式JavaScript框架Vue.js的官方中文门户,由Vue核心团队与中文社区合作维护,为广大中文开发者提供了高质量、与英文官网同步的文档和学习资源。
暂无评论...






