我想创建一个mp3文件,它接受文本并根据我在Python中提供的mp3文件的声音将其作为mp3文件导出给我

问题描述 投票:0回答:1

我写了代码,但推理库有问题,我无法安装它在错误中写道,即使我从编码器安装了编码器库,编码器库也有问题

import inference as encoder from vocoder import inference as vocoder from pathlib import Path import numpy as np import librosa text = "I am the best actor wrestler and a super star" in_fpath = Path("123456789.mp3") reprocess_mp3 = encoder.preprocess_mp3(in_fpath) original_mp3, sampling_rate = librosa.load(in_fpath) preprocess_mp3 = encoder.preprocess_mp3(original_mp3,sampling_rate) embed = encoder.embed_utternce(preprocess_mp3) with io.capture_output()as captured: specs = synthesizer.synthsize_spectrograms([text],[embed]) generated_mp3 = vocoder.infer_wavefrom(specs[0]) generated_mp3 = np.pad(generated_mp3, (0,synthesizer.sample_rate),mode="constant") display(Aodio(generated_mp3, rate = synthesizer.sample_rate))

回溯(最近一次调用最后一次):文件 “C:\Users\User\Desktop\g34g34\main.py”,第 878 行,来自 编码器导入推断为编码器 ModuleNotFoundError:没有模块 命名为“编码器”

javascript python python-3.x typescript python-2.7
1个回答
0
投票

您似乎正在尝试使用编码器-解码器模型进行文本到语音合成。但是,您的代码存在一些问题,例如导入语句以及您使用推理库的方式(这就是错误的来源)

首先,确保您已经安装了所有必需的库。您似乎正在使用一些自定义编码器和声码器库,但它们未正确安装或导入。

以下是使用 pip 安装所需库的方法:

pip install tensorflow-gpu==2.6.0 # or tensorflow if you're not using GPU
pip install tensorflow-io
pip install numpy
pip install librosa
pip install unidecode

然后,确保您已正确导入必要的模块:

from encoder import inference as encoder
from synthesizer import inference as synthesizer
from vocoder import inference as vocoder
from pathlib import Path
import numpy as np
import librosa
import io
from IPython.display import Audio

确保您已正确安装和导入编码器、合成器和声码器库。您可能需要单独安装它们或确保它们在您的环境中正确设置。此外,此错误可能是由于使用与您正在使用的库不兼容的 python 版本造成的,因此请确保:

a) 使用 python3

b) 使用与您已安装的这些库的版本兼容的 python3 版本

一旦确保一切设置正确,您就可以继续编写其余的代码。如果您仍然遇到问题,请提供有关您所面临的具体错误的更多信息,我很乐意为您提供进一步帮助。

© www.soinside.com 2019 - 2024. All rights reserved.