Hortonworks数据平台(HDP)是一个开源Apache Hadoop数据平台的发行版,其中包含一组位于HDFS和YARN之上的项目,作为Hadoop的核心层。
Apache Nifi将小于当前日期的文件移动到新的hdfs文件夹中
我正在创建端到端流,以通过对通过Tealium事件流接收的Json文件使用Consume Kafka来将数据消耗到HDFS中。目前,我已经使用Consum Kafka->评估Json ...
我可以使用管理员和密码登录Ambari。但是,当我使用相同的密码登录护林员时,它提示我“您输入的用户名或密码不正确。”我研究了很多,发现了这一点。 ...
Apache nifi将年,月和日时间戳附加到合并的输出文件中
我正在创建端到端流,以通过对通过Tealium事件流接收的Json文件使用Consume Kafka来将数据消耗到HDFS中。目前,我已经使用Consum Kafka->评估Json路径-> ...
运行ElasticSearch。重击:./bin/elasticsearch:权限被拒绝
我尝试在Hortonworks Data Platform中运行Elasticsearch。我收到错误“ bash:./bin/elasticsearch:权限被拒绝”。在下面您可以看到脚本的一部分。你可以帮帮我吗?提前致谢。 [root @ ...
我发现使用Google Cloud Shell访问我的hadoop数据文件系统非常困难(我已经在Google Cloud Platform上创建了一个集群以供学习)。通用的“ hdfs dfs -ls”或“ hadoop fs -ls ...
Oracle虚拟框错误:未能打开与Hortonworks会话
我研究已经在计算器的问题,这意味着升级到最新版本的虚框的;当时的一个问题,建议升级到V4.3.14。嗯,我开V 4.3.20 ....
我在AWS上设置了10节点HDP平台。以下是我的配置2服务器 - 名称节点和备用名称节点7数据节点和每个节点有40个vCPU和160 GB内存。我想计算......
我写了一个Spark应用程序来批量加载Phoenix Table。现在一切都工作了几个星期,但是有几天我遇到了一些重复行的问题。这是由错误的表统计引起的。 ...
在Hortonworks数据平台上从Capacity Scheduler切换到Fair Scheduler
我的组织目前正在使用Hortonworks HDP来管理我们的Hadoop集群。默认的YARN调度程序是Capacity Scheduler。我想切换到Fair Scheduler。我是全新的......
我用的是HDP3.1。而我Ambari将部署hadoop集群和配置单元。部署后,我可以成功运行shell中的配置单元。然后我部署了Apache Kylin2.6,它可以同步hive表。但是当我建立立方体时......
我们可以将sqoop数据导入hdfs和hive吗?我用两个不同的用户(root和admin)尝试了下面root和admin之间的命令[root] sqoop import --connect jdbc:mysql://10.6.162 ....
Hive INSERT to string column将数字字符串舍入
我的表看起来像这样:CREATE TABLE test_ids(id STRING)当我向这个字符串列插入一个大数值时,它会被舍入:INSERT INTO test_ids SELECT“12345678901234567890”当......
502代理错误,Oracle VM + Hortonworks沙箱
我是Hadoop的新手。带有HDP 2.3.2的带有Hortonworks沙箱(OS Red Hat 64位)的Oracle VM已启动并正在运行。当我试图通过http://192.168.56.101进行测试时,我得到502代理错误。代理错误......
在Apache Ranger中,当从ldap源同步用户信息时,是否会将密码复制到Ranger?如果是这样,Ranger是否仍然使用LDAP进行身份验证?
我正在尝试在HDP上安装Hue 3,我集成了服务Hue,它可以通过Ambari界面获得。我正在使用URL中提到的步骤:github.com/EsharEditor/ambari-hue-service,..
Hortonworks和cloudera公司现在合并,哪种认证更好?请分享您对此的看法。
我知道在设置新集群时为非root用户配置ambari,但是是否可以在由root运行的现有集群中执行此操作。赞赏你的帮助。
为什么我通过Hutonworks ODBC驱动程序通过Openquery在SSMS中运行的Hive QL查询产生错误?
我使用Apache Hive的Hortonworks ODBC驱动程序建立了与Hive服务器的连接。版本信息如下:操作系统:Windows Server 2012 R2标准配置单元:1.2.1000.2.6.5.4-1 Hadoop:2.7.3.2.6.5.4-1 ...
我在YARN集群(HDP 2.4)中使用Spark,具有以下设置:1 Masternode 64 GB RAM(可用50 GB)24个核心(可使用19个核心)5个Slavenode 64 GB RAM(50 GB可用),每个24个核心(19个) ...
我有一个用例,我需要从另一个流程中使用FlowFile。据我所知,所有流文件都保存在Content Repository中。因此,例如,我的第一个流程从DB读取数据,执行一些...