AWS S3 Vectors 全面上线：查询延迟低于 100 毫秒

2026-01-06 17:26

来源： OFweek人工智能网

近日，AWS 正式宣布其云对象存储服务 S3 Vectors 全面上线。

该服务原生支持向量数据的存储与查询。此次正式发布将单索引容量提升 40 倍，最高可容纳 20 亿条向量，并实现低于 100 毫秒的查询延迟。

该服务于今年七月曾开放预览。根据 AWS 披露，预览期间用户已创建超过 25 万个向量索引，并累计处理逾 400 亿条向量。预览阶段单索引上限为 5000 万条向量，而AWS首席开发者 Sebastian Stromacq 表示：

“
现在单索引可支持高达 20 亿条向量的存储与检索……用户可将全部向量数据集整合至单一索引，无需再通过分片或复杂的联合查询逻辑管理多个小型索引。

此外，该服务提升了查询性能：低频查询可在 1 秒内返回结果，高频查询延迟则控制在100毫秒以内，这对对话式 AI 等交互应用尤为有利。

官方数据显示，单次查询最多可获取 100 条结果，增强了检索增强生成（RAG）应用的上下文质量。写入性能方面，单向量更新最高支持每秒 1000 次 PUT 操作，支持小批量高吞吐写入，并能实时检索来自多并发源的新数据。

储存优先，节省成本

AWS 同时宣布两项关键集成结束预览、全面开放：用户可将 S3 Vectors 用作 Amazon Bedrock 知识库的向量存储引擎；其与 Amazon OpenSearch 的集成也已正式上线，用户可在使用 OpenSearch 进行搜索分析的同时，将 S3 Vectors 作为底层向量存储层。

开发者 Jalaj Nautiyal 在 LinkedIn 发文评价：S3 Vectors 将向量搜索从“计算优先”模式转变为“存储优先”方案。这一“无服务器”转型意味着用户不再需要管理集群、容器或分片，可像处理普通S3对象一样管理向量，轻松实现数十亿向量的存储。

成本方面，预计可将总拥有成本降低高达 90%，仅需支付 S3 存储费用（成本较低）与查询费用，无需承担闲置计算资源开销。

他进一步指出，对于 80% 的内部 RAG 应用与自主智能体场景，或许无需追求顶级配置的向量数据库。一个可靠且容量无限的“后备箱”已足够——S3正成为这样的存在。

目前S3 Vectors已在14个AWS区域上线（预览阶段为5个）。服务定价基于三个维度计算：