我如何将文本文件转换为小写并查找字母的频率?

问题描述 投票:1回答:3

我正在编写一个读取文本文件并输出字母频率的代码。我使用FileInputStream方法读取文件,但不知道如何将大写转换为小写。

该代码运行,但仅读取小写字母。我该如何解决这个问题?

java fileinputstream
3个回答
0
投票

此解决方案不会将大写转换为小写,但可以帮助您解决问题。

由于char值来自ASCII表,您可以像这样进行第二个循环:

char ch = 'A';

for(int i=0; i<26; i++){
    if(d==ch) {
        f[i] += 1;
    }
    ch++;
}

或者您可以使用以下命令在for循环中修改条件:

if(d==ch || d==(ch-32))

您可以在此处查看ascii表:https://www.cs.cmu.edu/~pattis/15-1XX/common/handouts/ascii.html


0
投票

如果被允许使用Java 8流以及诸如文件和路径之类的“新” IO对象,则可以非常简单地完成此任务:

Map<Character, Long> freq = Files.lines(Path.of(filepath))        // get stream of file lines
                .flatMap(s -> s.chars().mapToObj(c -> (char) c))  // convert each line into stream of characters
                .collect(
                    Collectors.groupingBy(Function.identity(),    // group by each character
                    Collectors.counting()));                      // count characters in the stream

如果只需要计算字母,则可以另外过滤它们:

Map<Character, Long> letterFreq = Files.lines(Path.of(filepath))
                .flatMap(s -> s.chars().mapToObj(c -> (char) c))
                .filter(Character::isLetter)
                .collect(
                    Collectors.groupingBy(Function.identity(), Collectors.counting()));

0
投票

您的程序效果很好。要转换为小写,请参见以下内容:

while ((d = fileInputStream.read()) != -1) {
    d = Character.toLowerCase(d); // <-- add this line here
    char ch = 'a';
    for (int i = 0; i < 26; i++) {

       if (d == ch) {               
           f[i] = f[i] + 1;
       }
       ch++;
    }
}

另外两个建议。

  • try块的末尾放置一个catch块。
} catch (IOException e) {
    e.printStackTrace();
}
  • 当您打印出字符时,请忽略计数为零的字符,以使频率计数更具可读性。

  • 并且原始数字数组被初始化为0,所以您不需要这样做。

© www.soinside.com 2019 - 2024. All rights reserved.