本笔记本是为以下场景准备的:
- 您的数据未向量化
- 您想在您的数据上运行向量搜索
- 您想将 Weaviate 与 OpenAI 模块 (text2vec-openai) 结合使用,为您生成向量嵌入。
本笔记本将引导您完成一个简单的流程,以设置 Weaviate 实例,连接到它(使用 OpenAI API 密钥),配置数据模式,导入数据(这将自动为您的数据生成向量嵌入),并运行语义搜索。
这是希望在安全环境中存储和搜索我们的嵌入以及他们自己的数据,以支持生产用例(如聊天机器人、主题建模等)的客户的常见需求。
什么是 Weaviate
Weaviate 是一个开源向量搜索引擎,可将数据对象与其向量一起存储。这允许将向量搜索与结构化过滤相结合。
Weaviate 使用 KNN 算法创建向量优化的索引,这使您的查询能够极速运行。在此处了解更多 信息。
Weaviate 让您可以使用您最喜欢的 ML 模型,并无缝扩展到数十亿个数据对象。
部署选项
无论您的场景或生产设置如何,Weaviate 都有适合您的选项。您可以在以下设置中部署 Weaviate:
- 自托管 – 您可以使用 docker 在本地或任何您想要的服务器上部署 Weaviate。
- SaaS – 您可以使用 Weaviate Cloud Service (WCS) 来托管您的 Weaviate 实例。
- 混合 SaaS – 您可以在您自己的私有云服务中部署 Weaviate。
编程语言
Weaviate 提供四个 客户端库,允许您从您的应用程序进行通信:
此外,Weaviate 还有一个 REST 层。基本上,您可以使用任何支持 REST 请求的语言调用 Weaviate。