Kusto 作为向量数据库

2023年5月10日
在 Github 中打开

Azure 数据资源管理器 (又名 Kusto) 是一种基于云的数据分析服务,使用户能够对大型数据集进行实时高级分析。它尤其适用于处理大量数据,使其成为存储和搜索向量的绝佳选择。

Kusto 支持一种名为 dynamic 的特殊数据类型,可以存储非结构化数据,例如数组和属性包。Dynamic 数据类型 非常适合存储向量值。您可以通过在表中将与原始对象相关的元数据存储为单独的列来进一步增强向量值。
Kusto 还支持内置函数 series_cosine_similarity_fl 来执行向量相似度搜索。

免费开始使用 Kusto。

Kusto_Vector

Kusto 和 Open AI 嵌入入门

演示场景

Wiki_embeddings

semantic_search_flow

如果您想尝试此演示,请按照 Notebook 中的说明进行操作。

它将允许您 -

  1. 使用由 OpenAI API 创建的预计算嵌入。

  2. 将嵌入存储在 Kusto 中。

  3. 使用 OpenAI API 将原始文本查询转换为嵌入。

  4. 使用 Kusto 在存储的嵌入中执行余弦相似度搜索。