delta湖表查询历史出错

问题描述 投票:0回答:0

我使用以下代码创建了一个 delta lake 表:

%%pyspark df = spark.read.load('abfss://出于隐私原因删除的电子邮件地址/data/MoviesDB.csv', format='csv' , 标题=真 )

delta_table_path = "/delta/movies-delta" df.write.format("delta").save(delta_table_path)

我创建了一个带有托管表的数据库:

spark.sql("创建数据库电影") df.write.format("delta").saveAsTable("Movies.MoviesManaged")

我使用 SQL 代码添加一行

%%sql INSERT INTO MoviesManaged VALUES(999999、'Nothing Hill'、'Romance'、1999、8、1)

我可以查询历史

%%sql 描述历史电影托管

但是当我尝试我在互联网上随处可见的关于如何请求特定版本的示例时,我在关键字 AS 上出错

%%sql 从 1

开始的 MoviesManaged 版本中选择 *

如果我尝试使用历史记录中的时间戳也是一样。我看起来应该添加一些模块。但我不知道如何进行这项工作。

有人能帮帮我吗?

version history delta
© www.soinside.com 2019 - 2024. All rights reserved.