如何在flink独立安装上进行kerberos身份验证？

Question

我有一个独立的Flink安装，在上面要运行将数据写入HDFS安装的流作业。 HDFS安装是Cloudera部署的一部分，并且需要Kerberos身份验证才能读取和写入HDFS。由于我没有找到有关如何使Flink与受Kerberos保护的HDFS连接的文档，因此我不得不对该过程进行一些有根据的猜测。这是我到目前为止所做的：

我为用户创建了密钥表文件。

在我的Flink工作中，添加了以下代码：

UserGroupInformation.loginUserFromKeytab("myusername", "/path/to/keytab");

最后我正在使用TextOutputFormat将数据写入HDFS。

[当我执行工作时，出现以下错误：

org.apache.hadoop.security.AccessControlException: SIMPLE authentication is not enabled.  Available:[TOKEN, KERBE
ROS]
        at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
        at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
        at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
        at java.lang.reflect.Constructor.newInstance(Constructor.java:422)
        at org.apache.hadoop.ipc.RemoteException.instantiateException(RemoteException.java:106)
        at org.apache.hadoop.ipc.RemoteException.unwrapRemoteException(RemoteException.java:73)
        at org.apache.hadoop.hdfs.DFSOutputStream.newStreamForCreate(DFSOutputStream.java:1730)
        at org.apache.hadoop.hdfs.DFSClient.create(DFSClient.java:1668)
        at org.apache.hadoop.hdfs.DFSClient.create(DFSClient.java:1593)
        at org.apache.hadoop.hdfs.DistributedFileSystem$6.doCall(DistributedFileSystem.java:397)
        at org.apache.hadoop.hdfs.DistributedFileSystem$6.doCall(DistributedFileSystem.java:393)
        at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
        at org.apache.hadoop.hdfs.DistributedFileSystem.create(DistributedFileSystem.java:393)
        at org.apache.hadoop.hdfs.DistributedFileSystem.create(DistributedFileSystem.java:337)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:908)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:889)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:786)
        at org.apache.flink.runtime.fs.hdfs.HadoopFileSystem.create(HadoopFileSystem.java:405)

[出于某种奇怪的原因，即使我叫loginUserFromKeytab，Flink似乎也尝试使用简单身份验证。我在Stackoverflow（Error with Kerberos authentication when executing Flink example code on YARN cluster (Cloudera)）上发现了另一个类似的问题，该问题的答案解释为：

独立Flink当前仅在所有工作节点上都通过了用户验证时才支持访问受Kerberos保护的HDFS。

这可能意味着我必须在操作系统级别进行一些身份验证，例如用kinit。由于我对Kerberos的了解非常有限，所以我不知道该怎么做。我也想了解在没有任何配置的情况下，kinit之后运行的程序实际上如何知道从本地缓存中选择哪个Kerberos票证。

Answer 1

为了从独立的Flink安装访问安全的HDFS或HBase安装，您必须执行以下操作：

登录到运行JobManager的服务器，使用kinit针对Kerberos进行身份验证，然后启动JobManager（无需注销或在两者之间切换用户。）>
登录到运行TaskManager的每台服务器，再次使用kinit进行身份验证并启动TaskManager（同样，使用同一用户）。

Answer 2

您还可以将独立群集配置为自己进行身份验证，而无需在作业中添加其他代码。

导出HADOOP_CONF_DIR并将其指向core-site.xml和hdfs-site.xml所在的目录

如何在flink独立安装上进行kerberos身份验证？

问题描述投票：0回答：3

3个回答

最新问题

如何在flink独立安装上进行kerberos身份验证？

问题描述 投票：0回答：3

3个回答

最新问题

问题描述投票：0回答：3