rsqlite_send_query(conn@ptr, statements) 中的错误:重复的列名:Ret

问题描述 投票:0回答:1

我有一堆运行良好的 sql 查询,但现在,由于某种原因,不再运行了。数据没有改变。代码没有改变。

我不断收到此错误消息:

rsqlite_send_query(conn@ptr, statements) 中的错误:重复列 名称: 雷特

这些错误往往发生在左连接中。下面是一个例子:

 g.cper<-sqldf("select a.*, b.NAV_EUR, b.AUM_EUR
           from g2_c as a
            left join 
            nav_master as b
            on a.fund_id=b.fund_id and a.period = b.period")

相关表都不包含名为“Ret”的变量

我最近更新了我的所有套餐。

这是遗留代码。我倾向于尽可能使用 dplyr::left_join 。但 left_join 永远不会做 SQL 中左连接可以实现的功能(不等式作为约束等)。

这些是我加载的包:

套餐<- c("ISLR","gam","biglm","dplyr","gtools","tidyr", "randomForest","splines", "tree", "pROC","lfe","lubridate", "stargazer", "scales", "ggplot2", "scales", "data.table", "zoo","PerformanceAnalytics", "stats","proto", "timeSeries","timeDate","gsubfn","fBasics","DBI","RSQLite","sqldf", "RODBC", "tcltk","reshape","xts", "data.table","parallel", "lfe", "readr", "purrr", "tibble", "hms", "stringr", "lubridate", "forcats")

这是我的会话信息():

sessionInfo() R 版本 3.3.3 (2017-03-06) 平台:x86_64-redhat-linux-gnu(64 位) 运行于:Red Hat Enterprise Linux服务器7.3(麦坡)

区域设置:1 LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
LC_TIME=en_US.UTF-8 [4] LC_COLLATE=en_US.UTF-8
LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8 [7] LC_PAPER=en_US.UTF-8 LC_NAME=C LC_ADDRESS=C
[10] LC_TELEPHONE=C LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C

附加基础包:1并行tcltk样条统计数据
图形 grDevices utils 数据集方法基础

其他附加包:1forcats_0.2.0
stringr_1.2.0 hms_0.3 [4] tibble_1.2 purrr_0.2.2
readr_1.0.0 [7] reshape_0.8.6
RODBC_1.3-14 sqldf_0.4-10 [10] RSQLite_1.1-2 fBasics_3011.87
gsubfn_0.6-6 [13] timeSeries_3022.101.2
timeDate_3012.100 proto_1.0.0 [16] PerformanceAnalytics_1.4.3541 xts_0.9-7 Zoo_1.7-14 [19] data.table_1.10.4 ggplot2_2.2.1
scales_0.4.1 [22] stargazer_5.2
lubridate_1.6.0 lfe_2.5-1998 [25] Matrix_1.2-8 pROC_1.9.1
tree_1.0-37 [28] randomForest_4.6-12
tidyr_0.6.1 gtools_3.5.0 [31] dplyr_0.5.0 biglm_0.9-1 DBI_0.5-1 [34] gam_1.14 foreach_1.4.3
ISLR_1.0

通过命名空间加载(且未附加):1 reshape2_1.4.2
lattice_0.20-34 colorspace_1.3-2 chron_2.3-50 plyr_1.8.4
munsell_0.4.3 [7] gtable_0.2.0 codetools_0.2-15 memoise_1.0.0 labelling_0.3 Rcpp_0.12.9 xtable_1.8-2 [13] 摘要_0.6.12 字符串i_1.1.2 网格_3.3.3 工具_3.3.3 三明治_2.3-4
magrittr_1.5[19]lazyeval_0.2.0Formula_1.2-1assertthat_0.1 迭代器_1.0.8 R6_2.2.0

不确定这是否与这个问题相关请记住我正在使用RSQLite_1.1-2(早于2.0)

老实说我不知道发生了什么事,也没有在网上找到任何东西......

更新我:我已经升级到sqldf_0.4-11和RSQLite_2.0....仍然遇到这个问题。我还尝试加载 sqldf (和依赖项)...代码仍然不起作用

更新二:首先,我要感谢G。 Grothendieck 感谢他在这个问题上的帮助以及这些年来他对 R 的贡献。

在这个特定问题上,我尝试使用 mtcars 运行测试查询。这是代码:

b<- sqldf("select a.*, b.mpg as test
          from mtcars as a
          left join 
          mtcars as b
          on a.mpg=b.mpg")

此查询有效!!!。然后,我运行的代码即使在更新到 sqldf 0.4.11 和 RSQLite 2.0 后也无法正常工作(请参阅更新 I)。令我惊讶的是它现在可以工作了!!!....我不知道发生了什么,但我所有的 sqldf 查询现在都可以工作了。 仅供参考...我在 AWS 工作......我有时会发生这些无法解释的奇怪的事情......

更新III问题又回来了。所以我再次运行更新II中的测试代码。这有效。运行该测试代码后,我所有的 sqldf 连接再次工作......去图

r dplyr sqldf rsqlite fuzzyjoin
1个回答
0
投票

在这个可重现的示例中(使用 sqldf 0.4.11 和 RSQLiute 2.0),它按预期工作。

library(sqldf)

g2_c <- nav_master <- data.frame(fund_id = 1:2, period = 1:2, NAV_EUR = 0, AUM_EUR = 0)
sqldf("select a.*, b.NAV_EUR, b.AUM_EUR
       from g2_c as a
       left join nav_master as b
         on a.fund_id=b.fund_id and a.period = b.period")

给予:

  fund_id period NAV_EUR AUM_EUR NAV_EUR AUM_EUR
1       1      1       0       0       0       0
2       2      2       0       0       0       0
© www.soinside.com 2019 - 2024. All rights reserved.