我有一个镶木地板数据,当我在任何在线镶木地板查看器中打开它时,它会显示一些带有表情符号的数据,如果在突触中查询而不是它显示的表情符号,则显示相同的数据(??或\uD83E\uDD73)。
对此有什么建议吗?
我希望在突触工作区中也能看到相同的表情符号。
作为示例,我尝试了以下方法,将表情符号数据写入 Parquet 和 Delta 格式并读取它们。
from pyspark.sql import SparkSession
spark = SparkSession.builder \
.appName("EmojisToDeltaExample") \
.getOrCreate()
data = [('😊', 'This is a smiling emoji'),
('❤️', 'This is a heart emoji'),
('👍', 'This is a thumbs-up emoji')]
df = spark.createDataFrame(data, ['Emoji', 'Description'])
parquet_file_path = "abfss://[email protected]/example.parquet"
df.write.parquet(parquet_file_path)
delta_file_path = "abfss://[email protected]/example_delta"
df.write.format("delta").save(delta_file_path)
我已从 ADLS 查询镶木地板数据作为 Exteranl 表
我在复制活动中使用了 Parquet 文件来预览数据: