我们有一个postgresql数据库,该数据库每晚使用以下命令从cron作业进行备份:
su postgres -c "pg_dump our_database | gzip > /home/smb/shared/database_backup.bak.gz"
最近,我们遇到了一个磁盘故障,该故障始于几个坏扇区,在此期间,pg_dump退出,并出现以下错误
pg_dump: SQL command failed
pg_dump: Error message from server: ERROR: catalog is missing 17 attribute(s) from relid 20158
pd_dump: The command was: LOCK TABLE public.obvez IN ACCESS SHARE MODE
现在,由于它在cron作业中,没有人注意到错误消息,备份被中断,但它不是零大小,一切似乎都正常,错误被忽略,直到最终磁盘故障,当我们意识到我们没有备份。
我们设法从较旧的备份恢复了数据,但现在我想知道检查pg_dump是否成功完成其工作的正确方法是什么?
发布于 2011-06-14 09:09:31
我将结果写入日志文件,在cronjob结束时,我将日志文件的内容发送到我的电子邮件地址。这样,我就能知道什么时候出了问题。
su postgres "pg_dump our_database 2>> $LOG_FILE | gzip > /home/smb/shared/database_backup.bak.gz"
cat $LOG_FILE | mailx $MAINTAINERS -s "Postgresql backup"
附录:如果只想在出现问题的情况下发送邮件,可以检查pg_dump的返回代码:
LOG_FILE=/tmp/pgdump.err
if ! pg_dump -U backupuser "our_database" 2> $LOG_FILE
then
cat $LOG_FILE | mailx 'youremailaddress' -s "Postgresql backup failure!"
fi
https://stackoverflow.com/questions/6341321
复制相似问题