我需要从epub获取文本
from epub_conversion.utils import open_book, convert_epub_to_lines
f = open("demofile.txt", "a")
book = open_book("razvansividra.epub")
lines = convert_epub_to_lines(book)
我用它但是如果我使用print(线条)它只打印一行。图书馆已有6年历史。你们知道一个好方法吗?
convert_epub_to_lines返回一个迭代器到行,你需要逐个迭代才能得到。
相反,您可以使用“转换”获取所有行,请参阅库的文档:
怎么样https://github.com/aerkalov/ebooklib
EbookLib是一个用于管理EPUB2 / EPUB3和Kindle文件的Python库。它能够以编程方式读取和写入EPUB文件(Kindle支持正在开发中)。
API旨在尽可能简单,同时使复杂的事情成为可能。它支持封面,目录,书脊,指南,元数据等。
import ebooklib
from ebooklib import epub
book = epub.read_epub('test.epub')
for doc in book.get_items_of_type(ebooklib.ITEM_DOCUMENT):
print doc