2015年10月30日の午後に管理人のメインのサイトが落っこちたことは記事にした。
その後は回復して動いているし記事もどんどんアップしている。
昨日になってレンタルサーバー業者からメールが来ていたのだった。
サーバーの不調の原因はなに?
レンタルサーバーはさくらインターネットだが落っこちた原因は発表が無い。
障害発生期間は2015年10月30日14時28分~2015年10月30日15時29分となっていて約1時間くらいだ。
昨日来ていたメールによるとサイトの中身を2015年10月30日11時11分時点に戻してあるとのことだ。
ここから想像できるのはなにかしらのハードウェア障害(たぶんディスクだろう)が発生してハードを交換してデータをバックアップから戻したという事が想像できる。
という事は11時11分から14時28分の間にサイトの内部のファイルを弄っていたか?という事だ
調べてみるとこの日は8時頃に記事をアップし、その後夕方の18時頃に再びアップしている。
それ以外は触っていないので問題はなさそうだ。
確かにこの障害発生時刻の前後はサイトが重かった。
たぶんサイトを生かしたまま切り替え作業を行っていた時間帯があるのだろう。
壊れたファイルがあるかも?
そのメールには今回のダウンで壊れたファイルがあるかもしれないが特定できないのでユーザー側で確認せよとのことだ。
ただ管理人のサイトではそれが発生していないとの事。
分かりにくい・・・。
さらに障害発生前には存在していたが今は存在しないというファイルがあればアップをしてくれとの事だ。
うーんこれもこちらでは分からないではないか。
今のところおかしな動きはしていないので大丈夫だとは思う。
バックアップは取っているが
WordPressがメインのサイトなのでCRONを走らせて夜間にバックアップを走らせている。
最初は外部のDropBoxに保存をしていたのだがすぐに一杯となってしまうので現在はサーバーの中にいくつかの世代を置いている。
しかし今回のようなサーバーに障害が発生した場合にそのバックアップファイルを取り出せるのかという問題が付きまとう。
現実的な運用としてバックアップファイルを毎日ダウンロードするのもたぶん難しいだろう。
バックアップファイルの保管場所の問題は良く考えなければならない。
それに加えて最低限バックアップファイルからサイトを復活させる手順を確立しておかねばならないのを痛感した。
これは商用サイトでは当たり前の事だが管理人のような個人のブログではあまり対策されていないのではないだろうか。
規模が大きくなってくるとキチンと対策する必要がある。
今回はこのへんで
では