我正在开发Google应用程序迁移/存档系统,在开发的这一点上,我正试图想出一种方法来下载我的域用户创建的所有组中的所有邮件。我知道我可以设置转发过滤器并将所有邮件存档到电子邮件中,但这对旧邮件没有帮助。
有没有办法从Google网上下载这些邮件?如果是这样,是否有管理API可以获取用户创建的所有群组的列表?
如果您不介意使用#bash,您可以尝试我编写的工具
https://github.com/icy/google-group-crawler
它可以从Google Group下载所有mbox文件。如果你有一个cookie文件,你甚至可以从私人谷歌集团下载所有文件, 和/或查看所有原始电子邮件 。它还可以读取RSS订阅源并获取最新帖子;这对日常镜子很有用。
一个示例结果在这里http://l.archlinuxvn.org/archlinuxvn/。 MHonArch用于将mbox
文件转换为HTML格式。
最后,我最终使用gdata python库来获取所有组的列表及其各自的URL。从那里我用selenium刮取组的消息和所有回复。可能不是最好的解决方案,但它适用于我需要的东西。
我使用selenium和htmlunit做了一个简单的废料实用程序..你可以使用它..它不是非常优化,可以帮助你只下载小组的消息(最多7000 msgs)