「カテゴリ」や「分類」が設定されているデータを分析していると
「その他」の件数が、割と多い
という状況に遭遇することがあります。
例として、インシデントデータを考えてみましょう。
古い記事で恐縮ですが、以下のブログ記事ではインシデントの区分分けを提案しています。
この区分に従って分類された、インシデントのデータを分析するケースを考えてみます。
インシデントの分析ってどうすんの?
http://www.unirita.co.jp/blog/systems-operation/it-service/20140806.html
具体的には以下の状況です。
このようにして区分分けされたデータを集計するとき、「その他」に属するインシデントは、他のどの分類にも当てはまらないインシデントなので、少ないのではないか、と考えてしまいがちです。例えば下図のイメージです。
ところが、実際にデータを集計してみると、「その他」に属するインシデントが割と多いことがあります。下図のイメージです。
「ハードウェアに次いで多発しているトラブルって何?」という話になり、該当するインシデントデータを調査して内訳を調べることになります。
ただ実際には、1つの分類が25%に達しているわけではなく、あくまでも既存の4つの分類に当てはまらなかったインシデントの合計が25%に達しているだけです。内訳を調べて数の多いものを分類に追加するなど、カテゴリやサブカテゴリを整理して再分類してみると、「その他」のデータは分割されていき、現状をより正しく反映した割合分布が得られると思います。
データに対してカテゴリやサブカテゴリを設定した後、途中でカテゴリの見直しを行わずにデータを溜め続けると、溜めたデータを分析しようとする段階になって、上記のようなことが起こる可能性があります。
データを起票する際に、以下のような状況が起きていないでしょうか。
そのときは、カテゴリを見直すタイミングが来ているのかもしれません。
現状の再確認として、「その他」のデータがどれ位あるのか、確認してみてはいかがでしょうか。
Rankingランキング
New arrival新着
Keywordキーワード