我正在寻找常见坏词列表,以便我可以创建过滤器。
最好是包含整个单词的列表,我不想过滤掉每个包含坏词的单词(即过滤所有包含 ass 的单词会过滤“assassinate”)
我收集了 12 种语言的 2200 个脏词:en, ar, cs, da, de, eo, es, fa, fi, fr, hi, hu, it, ja, ko, nl, no, pl, pt, ru, sv、th、tlh、tr、zh。
提供 MySQL 转储、JSON、XML 或 CSV 选项。
检查:不准说脏话。。他们目前的 api 有限,但您可以直接使用他们的搜索 url 发出 http 请求。
要插入 MySQL 数据库的单词列表和脚本:
我创建了 75 种语言的超过 5 万个单词的列表 看: https://github.com/LDNOOBWV2/List-of-Dirty-Naughty-Obscene-and-Otherwise-Bad-Words_V2