本笔记本逐步指导您如何使用 Tair 作为 OpenAI 嵌入的向量数据库。
本笔记本展示了一个端到端的流程,包括:
- 使用 OpenAI API 创建的预计算嵌入。
- 将嵌入存储在 Tair 的云实例中。
- 使用 OpenAI API 将原始文本查询转换为嵌入。
- 使用 Tair 在创建的集合中执行最近邻搜索。
什么是 Tair
Tair 是阿里云自研的云原生内存数据库服务。Tair 兼容开源 Redis,并提供多种数据模型和企业级能力,以支持您的实时在线场景。Tair 还推出了基于新型非易失性内存(NVM)存储介质的持久内存优化实例。这些实例可以降低 30% 的成本,确保数据持久性,并提供几乎与内存数据库相同的性能。Tair 已广泛应用于政务、金融、制造、医疗、泛互联网等领域,以满足其高速查询和计算需求。
Tairvector 是一种内部数据结构,提供高性能的实时向量存储和检索。TairVector 提供两种索引算法:分层可导航小世界(HNSW)和平坦搜索。此外,TairVector 支持多种距离函数,例如欧氏距离、内积和杰卡德距离。与传统的向量检索服务相比,TairVector 具有以下优势
- 将所有数据存储在内存中,并支持实时索引更新,以减少读写操作的延迟。
- 在内存中使用优化的数据结构,以更好地利用存储容量。
- 作为一个开箱即用的数据结构,在简单高效的架构中运行,无需复杂的模块或依赖项。
部署选项
- 使用 Tair 云向量数据库。 点击这里 快速部署。