我对 docker compose 文件中命名卷的功能有点困惑,特别是在备份/恢复我的应用程序时。
我实际上正在测试这个 dockercompose 文件:
version: '2'
services:
django:
build:
context: "{{ build_dir }}/docker/django"
depends_on:
- db
environment:
[...]
volumes:
- code:/data/code
- www:/var/www
- conf:/data/conf
networks:
- front
- db
expose:
- "8080"
entrypoint: "/init"
db:
build:
context: "{{ build_dir }}/docker/postgres"
environment:
[...]
volumes:
- data:/var/lib/postgresql/data
networks:
- db
volumes:
data:
www:
code:
conf:
networks:
front:
external:
name: "proxy_nw"
如文档所述,我尝试使用命名卷而不是仅数据容器。但是我应该如何备份我的数据呢?
使用纯数据容器我会做一个
docker run --rm --volume-from DOC backup_container save
,这真的很容易。
现在我读到in this topic我应该使用像
docker run --rm --volume data --volume www --volume code --volume conf backup_container save
这样的东西。这并不是那么简单,因为我有许多具有不同类型和名称的卷的应用程序,因此这意味着我保存数据的命令对于每个应用程序都必须不同。它使自动化过程复杂化。
编辑: 实际上这个语法
docker run --volume data --volume www container_image my_command
不正确。
它需要容器内的挂载点,所以它会是
docker run --volume data:/somewhere --volume www:/somewhereelse container_image my_command
。
因此,与备份容器一起使用更加复杂。
那么,在这种情况下,最佳实践是什么? 我应该只为我的所有容器使用一个命名卷吗?
实际上应该按照官方文档中写的方式进行。数据卷容器将其数据存储在“虚拟根目录”中,因此您应该使用下一个命令进行备份:
docker run --rm \
--volume [DOCKER_COMPOSE_PREFIX]_[VOLUME_NAME]:/[TEMPORARY_DIRECTORY_TO_STORE_VOLUME_DATA] \
--volume $(pwd):/[TEMPORARY_DIRECTORY_TO_STORE_BACKUP_FILE] \
ubuntu \
tar cvf /[TEMPORARY_DIRECTORY_TO_STORE_BACKUP_FILE]/[BACKUP_FILENAME].tar /[TEMPORARY_DIRECTORY_TO_STORE_VOLUME_DATA]
地点:
将数据放回卷中(恢复):
docker run --rm \
--volume [DOCKER_COMPOSE_PREFIX]_[VOLUME_NAME]:/[TEMPORARY_DIRECTORY_STORING_EXTRACTED_BACKUP] \
--volume $(pwd):/[TEMPORARY_DIRECTORY_TO_STORE_BACKUP_FILE] \
ubuntu \
tar xvf /[TEMPORARY_DIRECTORY_TO_STORE_BACKUP_FILE]/[BACKUP_FILENAME].tar -C /[TEMPORARY_DIRECTORY_STORING_EXTRACTED_BACKUP] --strip 1
地点:
基于这个答案。 我在这里做了一个简单的工具: docker_named_volume_backup
首先运行命令
docker volume ls
列出要备份的命名卷。
然后备份
#sudo backup_docker_volume.sh <volumn_name> <tar_file>
sudo bash ./backup_docker_volume.sh codimd_database-data backup1.tar
恢复
#sudo restore_docker_volume.sh <volumn_name> <tar_file>
sudo bash ./restore_docker_volume.sh codimd_database-data backup1.tar
这里是我如何备份和恢复 mongo volume 数据作为 docker image 的例子。
# let a9c25f42ccca be mongo container id
docker stop a9c25f42ccca
# create a temp container with volume taken from mongo
# make a local tar archive inside it
docker run --name temp_backup --volumes-from a9c25f42ccca ubuntu tar cvf /mongo_backup.tar /data/db
docker start a9c25f42ccca
# make an image and remove temp container
docker commit temp_backup my_mongo_backup
docker rm temp_backup
# push image with backup to remote registry if needed
docker push my_mongo_backup
和恢复。
#pull image if needed
docker pull my_mongo_backup
docker stop a9c25f42ccca
# run transient container out from image with backup
# take volume from mongo
# clear any existing data
# restore data from tar arhcive
docker run --rm --volumes-from a9c25f42ccca my_mongo_backup bash -c "rm -rf /data/db/* && tar xvf /mongo_backup.tar -C /data --strip 1"
docker start a9c25f42ccca
我终于改变了做法。我解析容器的体积以寻找挂载点,并将所有内容备份到 tar 中的单独文件夹中。
所以我没有使用容器来做它,而是使用外部脚本。我不知道这是否是更好的方法,但效果很好。
如官方文档所述,没有开箱即用的单一命令来备份/恢复卷。一个人应该通过将一个卷安装到某个容器并按照手册给出的某种合适的方式打包内容来自己完成它:
docker run --rm --volumes-from dbstore -v $(pwd):/backup ubuntu tar cvf /backup/backup.tar /dbdata
对于存储在卷中的普通文件,这可能就足够了,但对于数据库,最好使用一些转储生成工具。像
mongodump
/mongorestore
或 pg_dump
/pg_restore
来处理元数据而不是二进制文件。由于二进制文件备份与特定数据库版本有更紧密的耦合。
前段时间我遇到了这个问题,并开发了简单的脚本来满足我的需求。但随着我的应用程序和它们数量的增长,我决定让它变得普遍。最近我开源了一个我开发的tool,它可以选择将备份上传到 Google Drive 文件夹。
pip install cobra-archiver
备份所有卷。
cobra backup build
要备份除
skip-this-one
以外的所有卷并将备份放在 ./backup
目录中,可以使用它。
cobra backup build --exclude skip-this-one --backup-dir ./backup
备份并推送到 Google Drive.
cobra backup build --push \
--creds /path/to/google-service-acc-key.json \
--folder-id google-drive-folder-id \
--exclude skip-this-volume
此外,它还可以像这样备份普通文件系统目录
cobra backup build --dir ./backup/me
要查看特定命令的 cli 描述,该行如下所示。
$ cobra backup build --help
除了备份之外,它还可以轻松恢复以前备份的内容。
cobra backup pull --latest --restore \
--creds /path/to/google-service-acc-key.json \
--folder-id google-drive-folder-id
也可以自动进行“转储”数据库备份。要实现这一点,可以使用钩子。请参阅 github 上的详细信息。 e2e 测试源中提供了真实示例。