京つう

日記/くらし/一般  |伏見区

新規登録ログインヘルプ


2009年10月24日

これ深刻だと思います

出た出た。DBが存在する部分のディスクエラー。
当社で2回目。今度は従サーバだからそんなには焦っていない。
前回の不具合が出たとき作ったスクリプトのお陰で、不具合で
あることにも直ぐ気が付く。
これがなぜ深刻か
・ORCAの動作にほとんど問題がないため、異常に気が付かない
・バックアップが終了する。通常より早く終了はするが。
・下記の様なエラーを検出し、誰が見ても異常だと思うような
  メッセージを出さないと、ユーザは気が付かない。
  こんなメッセージが出るようにしました。
■■バックアップ異常。スカイ・エス・エイッチに連絡して下さい。■■
バックアップが正常にできていない→気が付かずに日数経過→
レセプトや照会などHDDの多くの部分を読み出す場合に始めて気が付く
→正常なバックアップはない→恐すぎ

hasegawa@orca2:~/orcadump$ sudo -u orca pg_dump -O orca > orca.dump20091024
Password:
pg_dump: ERROR: could not read block 3641 of relation "tbl_sryact": Input/output error
pg_dump: SQL command to dump the contents of table "tbl_sryact" failed: PQendcopy() failed.
pg_dump: Error message from server: ERROR: could not read block 3641 of relation "tbl_sryact": Input/output error
pg_dump: The command was: COPY public.tbl_sryact (nyugaikbn, ptid, sryka, sryym, zainum, rennum, srysyukbn, srykbn, jihimoneytotal, srycd1, srysuryo1, srykaisu1, meiskyflg1, autokbn1, inputnum1, jihimoney1, srycd2, srysuryo2, srykaisu2, meiskyflg2, autokbn2, inputnum2, jihimoney2, srycd3, srysuryo3, srykaisu3, meiskyflg3, autokbn3, inputnum3, jihimoney3, srycd4, srysuryo4, srykaisu4, meiskyflg4, autokbn4, inputnum4, jihimoney4, srycd5, srysuryo5, srykaisu5, meiskyflg5, autokbn5, inputnum5, jihimoney5, termid, opid, creymd, upymd, uphms, hospnum) TO stdout;

Posted by tsukasa at 21:53│Comments(3)
この記事へのコメント
私もpg_dumpの終了コード≠0で同期処理停止とアラーム出す仕掛けいれてます。
滅多にない・・けど、そのぶん突然出るとあせります。
Posted by △ISLAND at 2009年10月25日 00:24
△ISLANDさん
こんにちは。これ恐すぎますよね。前回は主サーバでしたが不整合無しだっただので、従サーバのデータを使いました。1台構成でこれが起こったら、1日分は再度手入れですなあ。それでもこのアラームの仕組みを作ったので、1日分の手入れで済むということですなあ。
Posted by tsukasa at 2009年10月25日 13:33
また出たぞ。どうにか回復できた。
これ1台構成で出たらこんな感じか。
(まだ出たこと無いけど)
1)前回の正常なバックアップでリストア
2)異常なDBからテーブル単位でバックアップ
 日々更新されないテーブルが壊れている
   →日々更新されるテーブルを(1)に戻す
 日々更新されるテーブルが壊れている
   →前回から追加されたデータを手入れ
Posted by tsukasa at 2009年11月03日 16:34
上の画像に書かれている文字を入力して下さい
 
<ご注意>
書き込まれた内容は公開され、ブログの持ち主だけが削除できます。