目前我有一个包含近 50kk 记录的数据库和一个包含近 20kk 记录的数据库,我需要与 PowerBI 连接,我尝试使用 MongoDB BI Connector,但速度太慢了,我能做些什么来加快速度吗?或者我应该转向更强大的东西来帮助我的 BI 团队?
需要详细识别性能瓶颈。
谢谢。
任何通过 ODBC 进行的操作(我猜这就是您正在使用的),都会很慢。一种方法是使用 Power BI 中的 r 从 MongoDB 获取数据。以下链接详细介绍了如何从 r 连接到 MongoDB:
查询准备好后,您可以从“获取数据”窗口中选择“R 脚本”来使用 r 查询。希望这有帮助。
= Python.Execute("import pymongo#(lf)import pandas as pd#(lf)#(lf)# 将这些值替换为您的 MongoDB 连接详细信息#(lf)MONGO_URI = ""YOURMONGOURI""#(lf)DATABASE_NAME = ""YOURDATABASE""#(lf)COLLECTION_NAME = ""YOURCOLLECTIONNAME""#(lf)#(lf)# 建立与 MongoDB 服务器的连接#(lf)client = pymongo.MongoClient(MONGO_URI)#(lf)# (lf)# 访问指定数据库和集合#(lf)db = client[DATABASE_NAME]#(lf)collection = db[COLLECTION_NAME]#(lf)#(lf)# 从集合中获取数据(可以自定义查询) )#(lf)query = {} # 获取所有文档#(lf) #(lf)cursor = collection.find(query)#(lf)#(lf)# 将游标数据转换为字典列表#(lf) data_list = list(cursor)#(lf)#(lf)# 关闭 MongoDB 连接#(lf)client.close()#(lf)#(lf)# 将数据列表转换为 pandas DataFrame#(lf)df = pd.DataFrame(data_list)#(lf)#(lf)# 打印 DataFrame#(lf)print(df)#(lf)")
将此代码粘贴到空白查询 PYTHON 脚本中