本笔记本专为以下场景准备:
- 您的数据未被向量化
- 您希望在您的数据上运行混合搜索(了解更多)
- 您希望将 Weaviate 与 OpenAI 模块 (text2vec-openai) 结合使用,为您生成向量嵌入。
本笔记本将引导您完成一个简单的流程,以设置 Weaviate 实例,连接到它(使用 OpenAI API 密钥),配置数据模式,导入数据(这将自动为您的数据生成向量嵌入),并运行混合搜索(向量和 BM25 搜索的混合)。
对于希望在安全环境中存储和搜索我们的嵌入以及他们自己的数据,以支持诸如聊天机器人、主题建模等生产用例的客户来说,这是一个常见的需求。
什么是 Weaviate
Weaviate 是一个开源向量搜索引擎,用于存储数据对象及其向量。这允许将向量搜索与结构化过滤相结合。
Weaviate 使用 KNN 算法来创建向量优化的索引,这使得您的查询能够非常快速地运行。 在此处了解更多信息。
Weaviate 允许您使用您最喜欢的 ML 模型,并无缝扩展到数十亿个数据对象。
部署选项
无论您的场景或生产设置如何,Weaviate 都有适合您的选项。您可以在以下设置中部署 Weaviate:
- 自托管 – 您可以使用 Docker 在本地或您想要的任何服务器上部署 Weaviate。
- SaaS – 您可以使用 Weaviate 云服务 (WCS) 来托管您的 Weaviate 实例。
- 混合 SaaS – 您可以在您自己的私有云服务中部署 Weaviate
编程语言
Weaviate 提供四个客户端库,允许您从您的应用程序进行通信
此外,Weaviate 还有一个 REST 层。基本上,您可以使用任何支持 REST 请求的语言调用 Weaviate。