从文本中提取困难的单词

问题描述 投票:0回答:1

我需要从输入文本中识别困难的单词。我不想使用常用单词列表,因为需要为儿童设置难度级别。是否有计算每个单词难度的评分机制?我可以使用分数阈值来区分困难的单词和简单的单词。最终目标是为所有这些困难的单词提供单词含义。

可以通过多种方式对整体文本的复杂性或难度级别进行评分,例如。戴尔-查尔公式、冈宁雾公式等。然而,这些用于定义“可读性”,即读者理解书面文本的难易程度。我的要求与文本中各个单词的难度级别有关。

我遇到过一些定义困难单词的方法,例如超过 2 个音节的单词或任何未出现在 10000 个最常见单词中的单词等。但是,这些方法对我来说都没有用。我正在尝试构建一个可以识别困难单词的应用程序,并仅为这些单词提供相关的字典含义。是否有一种评分机制可以让我使用阈值将困难的单词与简单的单词分开?

nlp
1个回答
0
投票

我知道这是一个老问题,但我正在寻找同样类型的工具。你有找到类似的工具或者AI工具吗?

© www.soinside.com 2019 - 2024. All rights reserved.