我有 2000GB 的字符串数据,我的电脑有 2GB 的空间。我想返回数据中出现频率最高的前 10 个单词。
我在技术面试中被问到这个问题。我尝试使用 HashMap、优先级队列来解决这个问题,但面试官并不满意,因为最坏的情况是每个单词只出现一次。
如果您不着急,可以执行以下操作。
w