【実録】再現率0%の怪。私は如何にしてそのバグとの戦いを(一旦)終えたか


社内SEにとって、数千万円、数億円を投じた「新システムの本番稼働」は、プロジェクトのゴールではありません。ある意味、本当の「絶望」が幕を開ける日です。
導入直後、現場から飛んでくる「動かない」、「動きが違う」、「何か変なデータがある」という怒号。
エビデンス(証拠)も条件も分からないという状況で発生する謎のバグ。
そして、システム会社から返ってくる「エビデンスがなければ動きようもありません」という無慈悲な回答。
今回は、私がシステム会社とユーザーの板挟みになりながら、幽霊バグを追いかけた記録を綴ります。

現場の阿鼻叫喚と再現しないバグ

リリース当日。ユーザーから「データが消えた」「ボタンが反応しない」と連絡が入ります。
慌ててシステム会社に調査を依頼するも、返ってくるのはいつも同じ言葉。

「エビデンスがないと動きようがありません。再現手順を確定させてから再依頼いただけますか?」
社内SEなら分かるはずです、この言葉の絶望感を。

現場に確認したところ「証拠はないし、条件が分からない」と言われ発生する謎のバグ。対してシステム会社は「証拠がないと対応しようがない」。
私は、両者の間に横たわる「再現不能の溝」に独り取り残されました。

社内SEが見た「現場のリアル」

とにかくシステム会社側も、証拠がないことには動きようがありません。
「再現手順を確定させる」ため、こちらはシステムを動かし何とかして条件を探し続けます。
他にも現場を回りながら目にしたのは、社内SEもシステム会社も想像しなかった「現実」でした。

職人ならではの技

業務の「職人技」の超高速入力: 画面が読み込まれる前にEnterキーを連打して警告メッセージを一瞬で閉じる、ユーザー独自のクセ。ありえないスピードすぎて、警告メッセージが意味をなしていません。

想定外の動き

想定外の登録フロー: 設計時には思いもよらなかった手順でのデータ登録。
これらは、システム会社や社内SEの綺麗な検証環境では決して再現せず、思いつきもしなかった「現場特有の強者の不具合」でした。

戦略的撤退:私が打った「決着」の方法

どれだけ調査しても、どうしても100回に1回しか起きない現象は残ります。

まずは「証拠」を掴むこと

現場に何度もヒアリングして、その人の癖や現場の状況、以前のシステムの動きも加味して原因を特定していき、何とかして決定的瞬間を掴みます。スマホやスクリーンショットで動画や画像を撮ってもらうのも有効な手段でした。

原因が分かれば対処可能、分からなければ…

原因が分かればシステム会社にも正式に依頼できますが、どうしても特定できないものに関しては、運用回避で別案を出して対応するしかありません。

結末:バグは「解決」ではなく「風化」させる

原因が分かれば、システム会社に修正を依頼し、解決を図れます。

しかし、どうしても原因不明なものは、半年後にひょっこりと姿を現すこともあります。その時は静かにもう一度、お引き取り(運用回避)願うのみです。

「誰も原因を知らないが、なぜか平和になった」。

これが社内SEの戦いにおける、一つのハッピーエンドです。

最後に:板挟みで戦うあなたへ

システム会社が作る「完璧なシステム」と、現場の「カオスな現実」。
そのギャップを埋めるのが社内SEの仕事であり、再現不能バグはその摩擦から生まれる熱のようなものです。
原因がわからなくても、現場が回っていればあなたの勝ちです。
ハイゼンバグを追いかけて心を病む前に、まずは「網(ログ)」だけ張って、美味しいビールでも飲みに行きましょう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA