我一直在从事第二语言开发项目。我需要使用 Python 计算给定句子的 t-unit。例如,对于以下句子:
The man did not like water.
1 个 t-unit(该男子不喜欢水)
The man did not like water although he lived by the sea.
1个t-unit(这个人虽然住在海边,但不喜欢水)
The man never liked water and he certainly did not like living in the swamp with her grandparents.
1 个 t-unit(这个人从来不喜欢水) 1 t-unit(他当然不喜欢和她的祖父母一起住在沼泽里)
The man did not like water or juice.
1 个 t-unit(该男子不喜欢水或果汁)
我检查了 nltk、spacy 和 stanford nlp (stanza),但发现它们根本不包含此类 t 单元检测。
我遇到过this,但它是关于子句提取的。
知道如何使用 Python 检测此类 t 单元吗?
在筛选过程中与 Zuzu 的对话中,Zuzu 说道:“我……嗯……我的花瓣在我的口袋里。我很……很……我很难过,因为我美丽的花瓣碎了。”