此 notebook 示例展示了如何从大型数据集中获取嵌入。
1. 加载数据集
此示例中使用的数据集是来自 Amazon 的 fine-food reviews。该数据集总共包含截至 2012 年 10 月 Amazon 用户留下的 568,454 条食品评论。我们将使用该数据集的子集,包含 1,000 条最新的评论,以作演示说明之用。这些评论是英文的,并且倾向于正面或负面。每条评论都有 ProductId、UserId、Score、评论标题 (Summary) 和评论正文 (Text)。
我们将把评论摘要和评论文本合并成一个组合文本。模型将编码这个组合文本,并输出一个单向量嵌入。