在 Atlas 中可视化 Embedding

,
2023 年 3 月 28 日
在 Github 中打开

在本示例中,我们将上传食品评论 Embedding 到 Atlas 以可视化 Embedding。

什么是 Atlas?

Atlas 是一种机器学习工具,用于在您的 Web 浏览器中可视化海量的 Embedding 数据集。将数百万个 Embedding 上传到 Atlas,并在您的 Web 浏览器或 jupyter notebook 中与之交互。

!pip install nomic
import pandas as pd
import numpy as np
from ast import literal_eval

# Load the embeddings
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)

# Convert to a list of lists of floats
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #demo account

data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
                               id_field='id',
                               colorable_fields=['Score'])
map = project.maps[0]
map

项目:meek-laborer

投影 ID:463f4614-7689-47e4-b55b-1da0cc679559

隐藏嵌入的项目