在本示例中,我们将上传食品评论 Embedding 到 Atlas 以可视化 Embedding。
在本示例中,我们将上传食品评论 Embedding 到 Atlas 以可视化 Embedding。
Atlas 是一种机器学习工具,用于在您的 Web 浏览器中可视化海量的 Embedding 数据集。将数百万个 Embedding 上传到 Atlas,并在您的 Web 浏览器或 jupyter notebook 中与之交互。
!pip install nomic
import pandas as pd
import numpy as np
from ast import literal_eval
# Load the embeddings
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)
# Convert to a list of lists of floats
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #demo account
data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
id_field='id',
colorable_fields=['Score'])
map = project.maps[0]
map