2009/07/22

CIO補佐官と深夜のお茶会

久々に旧友と逢う。

転職したことをみんなに伝えてなくて、深夜思いつきでメールを15人くらいに送信。名前で調べたらCIO補佐官という肩書になっていた人から早速返信あり。

お酒はだいぶ前に止めたのを聞いていたが煙草もやめたらしい。ということで最寄りの喫茶店で情報交換。CIO補佐官という名前はかっこいいが、結局CIOという名前を持つお偉いさんの御守役で体のいいこまづかいといったところか。公共団体なので取り巻き企業の愚痴だらけで、あっという間に閉店の22時。19時半からだから2時間半延々と愚痴。それでもネタが尽きなかった。相当のストレスなのだろう。

収入面も、世相を受け下降傾向らしい。きらびやかな肩書とは真反対の現実を見せ付けられる。

面と向かっては言えなかったが、ちょっと太ったみたいだったし、髪も薄くなった気がした。つまりは自分もそれだけ歳をとったということで、ちょっとさびしくなった。

そのあと調べると、他にも偉くなった人がいた。雑誌編集長兼社長、ゲーム制作会社社長、中小企業社長も一人。なんか置いてかれてる気がした。もっとさびしくなった。

さてそろそろ自分も頑張るか。

2009/07/13

基礎体力が足りない

既にだいぶ間が空いてしまっていて、このブログの存在価値も薄れてしまったこのごろ。

自分としては後から読み返して「頑張ったな」と懐かしむために書いていたりするので、もう少し頑張って記録していきたいと思ってます。

過去リーダーシップを取ろうとして失敗したことは幾多。今回もなぜかTLという立場に。背伸びせず、ナチュラルにやってみようと思います。

それよりは未だ晴れない霧の中を手探りで進む現状の打開を進めないと。霧が晴れて進めると思った矢先にまたもや濃霧といったことが何度か続いてます。いつになったら全景を俯瞰できるのやら。

そして体力不足からか下痢が5日も続いて辛いです。そして昼に睡魔に襲われるというのも、仕事という緊張感が足りないからと自分の不甲斐なさに情けないやら。もちろん覚えなければならない事が山ほどあるのも原因なのですが。

2009/06/25

ご報告

とりあえずのご報告。

7月1日より、契約社員として某社社員になることが正式に決定いたしました。ご尽力いただいた関係各位には本当に感謝です。

これからが本当に厳しい日々となりますが、ひとつの山を越えられたということで、やっと落ち着いて物事を考えられる状態となりました。

まずは人生というシステムの再設計から手を入れます。腰を落ち着けると視野が開け、周りを見回す余裕が手に入ります。協力いただいた方々全ての意向を取り込んでいきたいと思いますが優先順位もありますし、それよりも自分の目標や野望があります。今週末はゆっくり設計図を描いていこうと思ってます。

次にありがとうと言うのはだいぶ先になるかもしれません。今はただのスタートであって、そこからどうダッシュするか、これまで縮めてきたバネの力を出すときです。一段飛躍したあとどの位置にたどり着いているかです。それまでは暫くガッツリ、ガシガシ働かさせていただきます。

ともかく今は関係各位に感謝であります。ありがとうございます。

2009/06/20

情報システム部屋さん

今日の夕方システムの不調が発生。システムの事を理解していないながらも対応を迫られる。

まずシステムにログインする方法を探す。運よく引継ぎ資料にあった。Tomcatが応答していないようだ。「使えない」というクレームがきているということは使えてる人はまずいないということで、問答無用に落とす。そして起動する。

ところが起動しない。何度やってもダメだ。特定のポートが云々言っている。こういう場合幾つか考えられる。
  • そのポートを使ってるプログラムがシグナルに応答しない→終了しない→再起動してきた同じプログラムがポートに繋げない
  • Well Known ポートでない場合や、特権範囲外のポートの場合、外部接続用のポートとして使われてしまっているとか
  • システムのメモリ上の情報が異常となってしまっている
  • ディスク関係のトラブル
今回の場合上二つは大丈夫だった。となると再起動したくなる。どうせサービスとしては停止しているのだからと「えいやっ」と決断した。が、甘かった。

前に運用を担当していた時は、まずpingを-tで打って、正常アクセスを確認している状態でshutdown -r nowみたいな感じでやっていた。しかも起動時にfsckとか動いてしまうと怖いからtune2fsとか使って起動時にfsckが絶対動かないようにしたりしていた。

今回はそんな事を調べることも考える余裕もなかった。あわててpingを打ったが当然ながら応答無し。そこから待つこと10分。流石にヤバイ。応答がない。fsckでエラーが出たか、fsに異常があってシングルユーザモードに落ちたか。もしかしてCDブートを切るのを忘れてて、かつCDを抜き忘れたとか。まさかboot時に特別な操作が必要なんてないよな、https使ってたな、SSLのフレーズ大丈夫かななんて超ブルー、だけど頭上では赤いパトランプ回転しまくり状態になった。

そこから慌てて対策を検討、連絡が取れるはずもない前任者の携帯番号を聞き出して電話するものの応答なし。別サーバからなら裏LANでアクセスできたりするかもしれないと考えて踏み台サーバにアクセスするも無応答。サービスを止め続けてしまったら大事だから事務所に飛んだ。

無応答だった踏み台サーバは熱暴走風味。古いノートでファンがガラガラ言ってたからそれが原因だろう。その サーバを再起動し、そこを踏み台に別サーバにアクセス。そこ経由で問題のサーバにアクセスするとなぜか応答あり。

とすると表LANが死んでるのか?と思って逆方向にpingするとちゃんと応答がある。ということはfirewallかと思って確認してもフィルタは空っぽ。なんでだーと探し回るとルーティングの設定が変なことに気づく。他とdefaultルートが異なってる。ただ直してみたが状況変わらず。

色々調べたり情報を聞きまわったりした結果、設置しているデータセンターのfirewallがちょっと曲者で、過去何度もアクセスをブロックされてしまった事があるらしい。しかもsshでのアクセスは通常の22番ではなくてちょっと変わったポート番号。

と言う話を頭でぐるぐるするとと閃いた。22番はうちでもアタックをよく受けていて半自動的にフィルタしていた。多分そのfirewallは22番宛でアクセスがあると即シャットアウトするのだろう。80番とか443番とかを空けるのは当然として、それ以外は基本honey potよろしくアタックのトリガとして検知しているのではないか。確かに自分は間違ってデフォルトでsshを実行してしまっていた。

ということで協力エンジニアに再確認。どうも外部向けのページは正常にアクセスできているらしい。なるほどっ。そんなこと引継ぎ資料に書いておいて欲しいところだ。おかげで4時間とガソリンを無駄にした。

結局詳細を知らないシステムは運用できない。できるのはルーチンワークだけだ。特に前任者不在とか引継ぎ不可能といったシステムはその後まともな運用にならないケースがほとんどだ。持って数年。その後「使えないシステム」の烙印を押されてリプレースの憂き目にあう。今回は立ち上げ直後だ。にもかかわらず運用の前任者はおろか開発者にすらまともに連絡が出来ない状況である。更に言えば社内システムすら管理者が消え、ネットワークの把握からの話になってしまっている。引き受けてから10日。こんな状態では保守開発にこぎつけるまでにはかなりの時間がかかりそうだ。

P.S.
調べてみると今日は情シスオフなんてのがあったらしい。なんだよ。行きたかったなぁ。でも行ってても今回のトラブルで結局飲み会の部は参加できなかった訳だし、まぁ次回参加予告でもしておこう。