2011年08月17日

[Episode6]標準化データ、偏差値の落とし穴

目 「Mさんに頼まれて、不具合指摘効率のデータを使って標準化データと偏差値を算出してみたんですけど、何かおかしくって・・・」

犬 「何がおかしいの?」

目 「Episode5の正規分布の時の話を参考にして、不具合指摘効率が低いプロジェクトをリストアップしようとしたんです。」
「閾値は同様に下位10%を基準としました。つまり標準化データで-1.28、偏差値で言えば37点です。」
「でも、そうすると何故か、閾値以下となるプロジェクトが無いんです。」
「普通に考えれば、データが100個有って、下位10%を閾値とした訳ですから、10個ぐらいのプロジェクトが該当すると思っていたのですが。」

犬 「Aちゃん、データ分析の際に、一番大切なことは何だったけ?」

目 「あっ、データを観察することでした。ヒストグラムを作成してみた方が良かったのかなぁ。」

犬 「その通り、まずはデータを観察することを怠ってはいけないよ。」続きを読む


posted by koike0125 at 12:21| Comment(0) | TrackBack(0) | 1変数の分析 | このブログの読者になる | 更新情報をチェックする

2011年05月28日

[Episode5]正規分布とは?

猫「そう言えば、正規分布について教えてもらう約束だったな。」

犬「えー、まあ、でも、どうしてまた?」

猫「この間の偏差値についてリーダー達に説明しようと思うのだが、その時にツッコミを受けてもね。」
「なので、一応それなりには理解をしておきたいんだ。」
「あっ、でも、数学は苦手なんで、数式とかは勘弁してくれよ。」


犬「はい、分かりました。」
「では、なるべく、直感的に分かるように図解で解説しますね。」

続きを読む
posted by koike0125 at 09:00| Comment(0) | TrackBack(0) | 1変数の分析 | このブログの読者になる | 更新情報をチェックする

2011年04月02日

[Episode4]複数の指標を用いて総合評価するには

マネージャーのMさんが悩んでいる。

猫 「この間リリースしたプロジェクトなんだけど、前回の開発の時よりも、品質は向上しているのだけど、生産性は低下している」
猫 「このような場合、前回よりも改善出来たと言って良いのだろうか?」


犬 「それぞれのデータを使って総合評価をすれば良いのではないですか?」

猫 「総合評価って簡単に言うけど、生産性と品質の指標であるバグ密度の値は単位も違うし、単純に足し算なんて出来ないだろ?」

犬 「偏差値って覚えてます?あれを使えばいいんですよ」

猫 「偏差値?もちろん覚えているよ。あの忌々しいやつだろ。でも、テストの点数じゃあるまいし、偏差値なんて使えるのか?」


さて、実際のデータを見てみよう

続きを読む
posted by koike0125 at 15:02| Comment(0) | TrackBack(0) | 1変数の分析 | このブログの読者になる | 更新情報をチェックする
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。