在java.io.InputStream及其子类型中可靠地跳过数据

问题描述 投票:9回答:3

我正在处理二进制流,需要有效地跳过我不感兴趣的一系列数据,以及一些将被处理的数据。

InputStream.skip(long)在保证方面做得不多:

跳过并丢弃此输入流中的n个字节的数据。由于各种原因,跳过方法可能最终跳过一些较小数量的字节,可能是0.这可能是由许多条件中的任何一个引起的;在跳过n个字节之前到达文件末尾只有一种可能性。返回跳过的实际字节数。

我需要知道发生了两件事之一:

  1. 小溪结束了
  2. 跳过了字节

很简单。但是,在此描述中提供的宽大意味着,例如,BufferedInputStream可以跳过几个字节并返回。当然,它告诉我它只是跳过了那几个,但不清楚为什么。

所以我的问题是:你能以这样的方式使用InputStream.skip(long),你知道什么时候流结束或跳过成功?

java stream inputstream java-io skip
3个回答
9
投票

我认为我们不能得到一个非常强大的实现,因为skip()方法合同相当奇怪。首先,EOF的行为没有明确定义。如果我想跳过8个字节并且is.skip(8)返回0,那么判断我是否应该再次尝试并非易事,如果某些实现选择在EOF时返回0,则存在无限循环的危险。 available()也不值得信赖。

因此,我提出以下建议:

/**
 * Skips n bytes. 
 */
public static void myskip(InputStream is, long n) throws IOException {
    while(n > 0) {
        long n1 = is.skip(n);
        if( n1 > 0 ) {
            n -= n1;
        } else if( n1 == 0 ) { // should we retry? lets read one byte
            if( is.read() == -1)  // EOF
                break;
            else 
                n--;
        } else // negative? this should never happen but...
        throw new IOException("skip() returned a negative value - this should never happen");
    }
}

我们不应该返回一个值来通知“真正跳过”的字节数吗?或者是一个布尔值来告知已达到EOF?我们不能以强有力的方式做到这一点。例如,如果我们将skip(8)称为FileInputStream对象,it will return 8即使我们处于EOF,或者文件只有2个字节。但是该方法在我们想要的意义上是健壮的:跳过n字节(如果可能的话)并让我继续处理它(如果我的下一次读取返回-1,我将知道已达到EOF)。


2
投票

这似乎适用于跳过n字节:

long skippedTotal = 0;
while (skippedTotal != n) {
    long skipped = _stream.skip(n - skippedTotal);
    assert(skipped >= 0);
    skippedTotal += skipped;
    if (skipped == 0)
        break;
}
boolean skippedEnough = skippedTotal == n;

然而,目前尚不清楚它是否适用于可以传递给我的库的所有InputStream实现。我想知道实现我自己的缓冲跳过方法是否可行。


0
投票

这个问题我迟到了6年。

原则上,skip(int n)和readFully(int n)之间没有区别。在跳过的情况下,您对字节不感兴趣。

对于直播,即。 tcp套接字或附加到的文件,skip(n)一旦“跳过”0字节就会阻塞(等待),具体取决于用户的等待时间。

返回EOF或-1表示流的结束,应该返回给最终用户,因为在该点之后不会发生任何其他事情。

为了有效地跳过文件中的字节,我将探索随机io,channel。但是这种优化不能在任何输入流中变得通用。

© www.soinside.com 2019 - 2024. All rights reserved.