室壁运动代理蟒蛇流数据报告错误

问题描述 投票:2回答:1

想从一个Python代码创建一个简单的流数据,被附加到一个日志文件,并且使用室壁运动代理 - >室壁运动流水流数据加载到一个红移群集。

我确认Python代码被罚款运行,造成流正被追加到一个日志文件数据。我室壁运动代理成功启动和我核实,也做适当配置,以从日志文件中提取数据,并将它推到流水流。

蟒蛇文件是一个简单的代码,它随机记录纬度/多头头寸。这仅仅是做了样品流水流,因此所使用的示例数据:

latitude = 19.99
longitude = 73.78
file_n = '/tmp/random_lat_lon.log'

def generate_random_data(lat, lon, num_rows, file_name):
    with open(file_name, 'w+', 1) as output:
#        for _ in xrange(num_rows):
         while True:
            hex1 = '%012x' % random.randrange(16**12)
            flt = float(random.randint(0,100))
            dec_lat = random.random()/100
            dec_lon = random.random()/100
            output.write('%s,%.1f,%.6f,%.6f \n' % (hex1.lower(), flt, lon+dec_lon, lat+dec_lat))
            time.sleep(5)

generate_random_data(latitude, longitude, 5, file_n)

输出在random_lat_lon.log文件:

> 83d6c9f7a0be,25.0,73.782042,19.997504
> 18b69c5c5248,25.0,73.788921,19.995153
> 6a0d182996f0,91.0,73.783399,19.998097
> 431ba9e4f38e,0.0,73.781139,19.995481

当我检查室壁运动代理,我看到它不工作,我收到以下错误跟踪:

(FileTailer[kinesis:python-stream:/tmp/random_lat_lon.log*]) com.amazon.kinesis.streaming.agent.tailing.FileTailer [ERROR] FileTailer[kinesis:python-stream:/tmp/random_lat_lon.log*]: Error when processing current input file or when tracking its status.
java.lang.IllegalStateException
        at com.google.common.base.Preconditions.checkState(Preconditions.java:158)
        at com.amazon.kinesis.streaming.agent.tailing.TrackedFileRotationAnalyzer.findCurrentOpenFileAfterTruncate(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.SourceFileTracker.updateCurrentFile(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.SourceFileTracker.refresh(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.FileTailer.updateRecordParser(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.FileTailer.processRecords(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.FileTailer.runOnce(Unknown Source)
        at com.amazon.kinesis.streaming.agent.tailing.FileTailer.run(Unknown Source)
        at com.google.common.util.concurrent.AbstractExecutionThreadService$1$2.run(AbstractExecutionThreadService.java:60)
        at com.google.common.util.concurrent.Callables$3.run(Callables.java:95)
        at java.lang.Thread.run(Thread.java:748)

我室壁运动-Agent.json配置如下:

{
  "cloudwatch.emitMetrics": true,
  "kinesis.endpoint": "https://kinesis.us-east-1.amazonaws.com",
  "firehose.endpoint": "",

  "flows": [
    {
      "filePattern": "/tmp/random_lat_lon.log*",
      "kinesisStream": "python-stream"
    }
  ]
}

这与室壁运动流水(使用Python)我的第一个样品的实验室经验。思念的东西,我无法弄清楚。

可有人请建议帮助。让我知道你需要的任何细节。

问候

python-2.7 amazon-web-services amazon-kinesis amazon-kinesis-firehose amazon-kinesis-agent
1个回答
1
投票

我面临着同样的问题。看起来像从亚马逊室壁运动代理一个open issue。我通过具有.dummy扩展名的文件,先后代理了一个文件从任何给定时间点阅读解决了这个问题。

© www.soinside.com 2019 - 2024. All rights reserved.