Zeppelin:如何用sql读取DataFrame

问题描述 投票:1回答:1

我必须使用Zeppelin的python。我很新,我只找到关于pyspark进入Zeppelin的材料。我想用python导入一个数据帧,然后通过sql访问它:

%python    
import pandas as pd #To work with dataset
import numpy as np #Math library     
#Importing the data
df_credit = pd.read_csv("../data.csv",index_col=0)

如果我尝试:

%python
from sqlalchemy import create_engine
engine = create_engine('sqlite://')
df_credit.to_sql('mydatasql',con=engine)

然后访问它,即:

%sql select Age, count(1) from mydatasql where Age < 30 group by Age order by Age

我收到错误:“找不到表或视图”

我认为问题是%sql无法读取使用%python创建的变量,但我不确定。

python sql pandas apache-zeppelin
1个回答
1
投票

试试%python.sql口译员。你必须安装pandasql包。查看此link了解更多信息。

© www.soinside.com 2019 - 2024. All rights reserved.