我正在构建一个应用程序,它将帮助盲人以自己的方式发现障碍。为此,无论何时检测到任何对象,我都需要应用程序说出对象名称(即Chair,Table)。
我个人以前从未使用过TensorFlow,但是,如果它类似于Firebase ML Kit中的对象检测API,我将执行以下操作。
[您可以尝试在镜头前获取对象的标签,然后使用Android的TTS API大声读出字符串。
我不知道您的应用是Android还是iOS。我以前在Android上使用过TTS。
这里是文档:https://developer.android.com/reference/android/speech/tts/TextToSpeech
而且,这是我使用TTS构建的演示应用程序。它会读取您在inban EditText中键入的任何内容。
https://github.com/AlfredoBejarano/Android-Kotlin-Demos/tree/master/TextToSpeechDemo