Scribble at 2024-10-01 10:06:18 Last modified: 2024-10-01 10:13:17
どうなんだろう。僕は、情報セキュリティの実務家として予感みたいなものしかないけれど、こういう自動処理というのは何かすごく危険な気がするんだよね。そもそも、sshd というデーモンが停止する原因として、仮に sshd の挙動に何か重大な欠陥があったのだとして、それは自動処理でサービスを復旧してまで継続するような挙動なのだろうかと思う。ひょっとして、そういう欠陥を維持したままサービスを動かしてはいては逆に危ないんじゃないのかね。クラッシュするなり静かに止まるなり、そういう何らかの原因があってサービスが止まるなら、それはリモートで操作しては何らかの危険があるという単純な事実を示していると考えたほうがいいような気がするんだよ。なので、そうなったらデータ・センターでもどこへでも行くなり、あるいは現地で有償でメンテナンスしてもらえるスタッフに依頼するなりして、コンソールで接続して作業することが望ましいと思うんだよね。無理にデーモンを復旧させてサービスをどうあれ継続するというのはどうなんだろうと思う。
そもそも、これをシェル・スクリプトでやろうと systemctl でやろうとだね、すぐにまたデーモンがクラッシュしたらどういう設計になってるんだろうな。普通に考えたらクラッシュと復旧の繰り返しでサーバに過剰な負荷がえんえんとかかり続けるわけだけど、そういうプロセス自体のせいでサーバが落ちてしまわないのだろうか。となると、せいぜい1分おきに復旧させるとか、サーバへ過剰な負荷がかからないような挙動の設計にしておくべきだろう。それから、もしこういうものを導入するなら、僕がサーバの管轄責任者であれば、この復旧システムそのものが誤動作しないような措置を講じておくね・・・つまり、こういうことは最後の最後はコンソールでサーバ機器にアクセスする手立てをどこかで用意しておくのが前提なんだよね。こういう復旧システムがあるから何かが安心だとか不要になるなんてことは、ありえないのだ。