2011年08月17日

[Episode6]標準化データ、偏差値の落とし穴

目 「Mさんに頼まれて、不具合指摘効率のデータを使って標準化データと偏差値を算出してみたんですけど、何かおかしくって・・・」

犬 「何がおかしいの?」

目 「Episode5の正規分布の時の話を参考にして、不具合指摘効率が低いプロジェクトをリストアップしようとしたんです。」
「閾値は同様に下位10%を基準としました。つまり標準化データで-1.28、偏差値で言えば37点です。」
「でも、そうすると何故か、閾値以下となるプロジェクトが無いんです。」
「普通に考えれば、データが100個有って、下位10%を閾値とした訳ですから、10個ぐらいのプロジェクトが該当すると思っていたのですが。」

犬 「Aちゃん、データ分析の際に、一番大切なことは何だったけ?」

目 「あっ、データを観察することでした。ヒストグラムを作成してみた方が良かったのかなぁ。」

犬 「その通り、まずはデータを観察することを怠ってはいけないよ。」続きを読む


posted by koike0125 at 12:21| Comment(0) | TrackBack(0) | 1変数の分析 | このブログの読者になる | 更新情報をチェックする

2011年05月28日

[BookReview3]正規分布

今回は、その名もずばり「正規分布」という書籍の紹介です。

多くの統計関連の良書を出版している東京図書の本で、著者は恐らく統計関連の書籍を一番多く出されていると思われる石村貞夫氏です。

石村氏の本は初心者向けのものが多く、ちょっとまどろっこしい感じも有るのですが、どれも演習形式で手を動かしながら学べるようになっている点が良いです。

続きを読む
posted by koike0125 at 15:12| Comment(0) | TrackBack(0) | 書評 | このブログの読者になる | 更新情報をチェックする

[Episode5]正規分布とは?

猫「そう言えば、正規分布について教えてもらう約束だったな。」

犬「えー、まあ、でも、どうしてまた?」

猫「この間の偏差値についてリーダー達に説明しようと思うのだが、その時にツッコミを受けてもね。」
「なので、一応それなりには理解をしておきたいんだ。」
「あっ、でも、数学は苦手なんで、数式とかは勘弁してくれよ。」


犬「はい、分かりました。」
「では、なるべく、直感的に分かるように図解で解説しますね。」

続きを読む
posted by koike0125 at 09:00| Comment(0) | TrackBack(0) | 1変数の分析 | このブログの読者になる | 更新情報をチェックする
×

この広告は180日以上新しい記事の投稿がないブログに表示されております。