我的数据不会超过10 GB,我需要将它放在分布式缓存中并为每条记录访问它以便从我的Flink流应用程序进行验证。哪一个最适合这个用例?我在hazelcast和redis之间感到困惑。
显而易见的解决方案是将这些数据保持在Flink状态,而不是在某些外部系统中。
要更新数据,请从Flink支持的任何数据源(例如文件系统或消息队列)中流式传输新版本。