Cloudera Inc.是一家位于Palo Alto的企业软件公司,提供基于Apache Hadoop的软件和服务。
nifi FlowFile 尚未关闭(Groovy 脚本)警告
nifi 术语和流文件处理的新内容。 找到了一种处理传入 xml 并使用 XmlSlurper 解析它的便捷方法,但收到以下针对传入流文件的 GroovyScript 的警告...
为什么start-all.sh从根本原因“无法启动org.apache.spark.deploy.master.Master:JAVA_HOME未设置”?
我正在尝试通过在cloudera Quickstart VM 5.3.0上运行的独立Spark服务来执行通过Scala IDE构建的Spark应用程序。 我的cloudera帐户JAVA_HOME是/usr/java/default
我尝试使用SSIS将数据插入到Cloudera/Hive。我使用ODBC从SSIS到Cloudera的连接。 我在执行任务时遇到问题,为插入生成的脚本包括双配额...
SQLAlchemy 通过 cloudera ODBC DSN 访问 Impala 数据库时出现问题
我正在尝试通过 SQLAlchemy 访问 Impala DB - 我已经配置了一个 DSN,允许我在直接使用 pyodbc 时连接到数据库。 但是,当使用 SQLAlchemy 时,我收到错误: 当使用...
我已经使用oozie有一段时间了,我想杀死一个协调员,但我不想杀死由协调员启动的工作流程。 我为什么要这么做?我有一个场景
据我所知,在从一个 HDFS 位置移动到另一个位置时,没有直接的选项可以覆盖 HDFS 中的文件,复制 cp 可以选择强制。我正在尝试寻找是否有...
Spark java.io.EOFException:过早的 EOF:没有可用的长度前缀
我正在尝试读取 parquet 文件并对其执行一些操作,并将结果作为 parquet 保存在 HDFS 上。我正在使用 Spark 进行此操作。这样做时我遇到了以下异常。 java.io.
我正在尝试从 jupyter-notebook 运行 impala,如下所示-- 从 impala.dbapi 导入连接 conn = 连接(主机='xx-xx-xx.xx.com', 端口=21000, auth_mechanism =“...
Windows MIT Kerberos,错误 1765328190,krb5_cc_set_flags
在测试与 HIVE 的 ODBC 连接期间,我遇到了 MIT Kerberos 错误 凭据缓存权限不正确(Kerberos 错误 -1765328190) krb5_cc_set_flags 失败 你如何解决这个问题? ...
我正在尝试在我的 Hadoop 集群上创建一个监控和可观察性基础设施。 我的集群是通过cloudera manager管理的,因此我有一些问题,也许你们中的一些人会...
在 Hadoop HDFS 中,删除几个早于 x 天且名称中有空格的文件(不像 UNIX)
我在一个hadoop目录下有几十万个文件,我需要调试它们。我想删除超过 3 个月的文件,我正在尝试批量删除一千个文件...
Load_libs already has been called error while installing hue on redhat?
我从github上克隆了hue 我将 python 版本导出到 3.8 并运行 make apps 它运行良好,直到最后,但最后在运行诸如...python /build/env/bin/hue --migration 之类的 hue 命令时,它给出了
我有一张表,在一个双精度字段中有“NaN”。我只是想计算有多少项目是“NaN”: 从表中选择计数(*) 其中 col = 'NaN' AnalysisException:DOUBL 类型的操作数...
我正在尝试按照官方链接在 Redhat 上安装 Apache Impala,但这没有用。 谁能给我提供正确的文件来安装 Impala 的开源版本或指南...
我们可以通过任何方式控制主题的最大大小(不是主题中的消息大小)吗?
在我们的环境中,我们的集群与多个应用程序共享,其中一个应用程序团队在没有任何通知的情况下意外加载数据,并且由于所有磁盘都已满并且
我们想使用 HDFS 快照来保护数据免受人为错误。 但我想知道我们如何恢复配置单元表的快照。 我知道我们将需要再次重新创建模式/表,但我们如何...
YARN 应用程序退出,退出代码:-1000 无法初始化用户目录
我得到: 由于 appattempt_1427711869990_0001_000002 的 AM 容器退出,应用程序 application_1427711869990_0001 失败了 2 次,退出代码为:-1000,原因是:无法初始化用户
/etc/hadoop/ 位置中存在两个与 hadoop service_name conf.cloudera.hdfs 和 conf.cloudera.yarn 相关的目录,因此根据 cloudera 文档“HDFS_service_name”给出但...
从MySQL导入Sqoop。小数总是以字符串的形式导入到Hive中。
我试图将数据从MySQL导入到Hive(Cloudera 5.8集群),HDFS有4个数据节点。使用Sqoop 1.4.6(附在Cloudera 5.8中),我一直试图直接从MySQL导入Hive ...
我们在Cloudera上有标准的日常摄取工作流。我正在寻找一种方法来重现一些原生的AWS行为,当使用ozie创建文件时触发spark作业。我发现输入事件,...