旅好きおやじの日記 TOP  >  自然科学・工学

統計学がわかる

統計学がわかる



大学に入り、統計学は必須科目であり、検定やら推定やら習った。

1年かけて色々学んだわけだが、理論ばかりだったので、何の役に立つ
かわからなかったし、大学を卒業して使うこともなかったので、記憶に
残っていない。

回帰分析や因子分析については、別の本を先に読み、また数年前にも
統計や確率の本を読んでイメージしやすい題材だったこともあり、何に
使うかの理解はしているつもりだが、分析手法やさらにその基礎となる
検定や推定といった部分が知識として抜けていたので、この本で学習
した。

ハンバーガーショップのポテトという題材で、その長さの平均や分散を
計算すると行った高校レベルの初歩的な解説から始まり、

箱に入ったポテトを標本として、箱をいくつか無作為抽出して、箱に入っ
たポテトの平均本数が、すべての箱の平均本数を95%や99%の確率で
どの範囲に入っているかを推定する、区間推定、

推定では、分散ではなく、サンプルサイズ-1を使う不偏分散を使うことや、
推定区間を求めるためにt分布表を使うことも復習することができた。

あとは、検定。
自分の店とライバル店の間で売上構成に「差はない」仮説を立て、
それを確率分布表の1%や5%の部分より外に外れれば棄却、内に入って
いれば採択し、比較する内容によってカイ二乗検定、t検定、F検定がある
ことが復習できた。

最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
スポンサーサイト
[ 2017年08月31日 05:12 ] 数学 | TB(-) | CM(0)

統計学がわかる 【回帰分析・因子分析編】

統計学がわかる 【回帰分析・因子分析編】



6年ほど前に多変量解析の本を読んだ。(下記URLの第10位の本)
http://yama2190.blog.fc2.com/blog-entry-145.html


そのときに、参考にした「アイスクリーム統計学」のサイトについて本も出て
いるので、久しぶりに本を借りて読むことにした。

やはり、分かりやすかった。

私の統計に関する知識は、「相関係数の絶対値の大きさが大きいほど、
相関関係が強い」ぐらいのざっくりとした知識しか残っていなかったのだ
が、久しぶりに読んで、「無相関検定」と「偏相関」について思い出し、
理解することもできた。

相関係数が高ければ、則ち関係が高いかというとそうではなく、標本数
も関係するという、いわば当たり前の話だがちゃんと理解ができた。

例えば、標本数が3と極端に少ない標本では、縦一列に並んでいて、相関
係数が高かろうが、正三角形の形になって相関係数が低かろうが本当に
相関性があるかどうかは言えないというのは直感的に理解できる。

これが、標本数400で同じように縦一列に並んでいたら、相関性があるし、
バラバラだったら相関していないことが理解できる。

相関係数を語る上で、標本数が重要な要素になり、
「相関係数の絶対値の低さがある程度以下であれば相関関係がない」
と検定することを無相関検定であると理解できた。

ここで、なぜ相関があることを検定するのではなく、無相関であることを検
定するのかというと、相関があるかどうかというのは-1~1までの数値を
無限に取ることができてしまうが、相関がないかどうかというのは0という
値だけを検定すれば良いからだという。

これを「帰無仮説」という。

大学のときに「帰無仮説」とか習い、語呂だけ覚えていたのだが、その
意味することが理解(再復習)できてよかった。


最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年08月24日 04:08 ] 数学 | TB(-) | CM(0)

ようこそ「多変量解析」クラブへ

ようこそ「多変量解析」クラブへ



ビッグデータというキーワードが数年前から流行り、ここ1、2年はデータサ
イエンスというキーワードを聞くようになった。

データの分析といえば、大学3年のときに勉強した多変量解析と、このブ
ログを書きはじめて、何冊か多変量解析の本を読んだりした。

前に読んだのが、5年前であり、細かい部分の記憶がちょくちょく欠落して
いたので、また勉強しようとこの本を借りた。

多変量解析についての解説本だと思っていたのだが、なぜか萌えキャ
ラが出てくる本だった。

その萌えキャラたちは、とある高校の数学クラブの女子高生なのだが、
1人は数学に詳しく、もう2人はそれほどでもない。

それなのに、会話の内容が、多次元尺度構成法とか主成分分析、な
どの多変量解析の用語や、それの基本となる行列の固有値や固有
ベクトルと言った大学で習う知識をバシバシ使いこなしており、すごい
違和感があった。

なので、まったく知識のない人が読んだら、撃沈するだけの本だったが、
それでも根気よく読むと、多変量解析をどういう場面で使うのかがわか
るようにはなっていた。

他の本でもうちょっと勉強しようと思う。

最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年08月11日 04:36 ] 数学 | TB(-) | CM(0)

直感を裏切る数学

直感を裏切る数学




直感を裏切る数学をテーマに、20個のお題を紹介している。

不景気なのに、高所得者層、低所得者層とも平均所得が増えるという話は、
高所得者の中の下位層が、低所得者層の上位層になるためという理屈
は分かりやすかったが、それ以外はちゃんと解説を読まないと理解ができ
なかった。

私も直感を裏切られた。

印象に残った問題は四色問題と、モンティ・ホールの穴の問題。

四色問題とは、地図上の隣り合う国々を違った色で塗り分けるには最低
何色か?

答えは四色なのだが、これを証明するためにはシンプルな公式などでは
無理でコンピュータの力を借りなければ証明できない計算量が必要だと
いうことである。

数学者たちはコンピュータを用いたシンプルではない証明を怒りをもって
迎えたという。

次にモンティ・ホールの穴というのは次のような問題である。
・3つの箱の中に1つが当たり、2つがハズレである
・プレイヤーが1つの箱を選択する
・ゲームのオーナが3つの箱のうち1つを選んでそれがハズレだった

このとき、プレイヤーに残り2つの箱についてもう一度選択して良いという
チャンスが与えられた場合、どうするのが良いか?

という問題である。

ゲームのオーナが箱を開けてそれがハズレだったとしても、プレイヤーが
選択した箱に変わりはないのだから、箱を変えても変えなくても答えは同
じなはずなのだが、実際はプレイヤーがもう一つの箱を選択するというの
が最適な選択らしい。

この説明はブログでやるより、Wikiを見たほうがわかりやすいのでリンク
を貼っておく。

Wikipedia「モンティ・ホールの問題



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年07月25日 04:51 ] 数学 | TB(-) | CM(0)

次の首都圏巨大地震を読み解く

今月のニュースで、元東大教授で米国生まれの地震学者ロバート・ゲラーさ
んが、イギリスの科学雑誌ネイチャーで、「日本政府は地震予知ができぬこと
を認めるべき」と論考をしていたことが書かれていた。

偶然、そのとき私はこの本を読んでおり、科学的な地震の余地は無理だと
わかった。

関東大震災や東日本大震災で、いつ首都圏直下型地震が起きてもおかしく
ないので、その備えをしましょうと政府、行政は言っているが、東海地震など
はもう40年も前からいつ来てもおかしくないと言われているのに、未だに来て
いない。だから準備はしているが心のなかでは油断しまくっており、いざ地震
が来てもうまく対応ができないのではないかという。

日本列島で記録に残っている地震は千年前後であり、それに対してプレー
トとか活断層の活動は何十万年周期に及ぶ場合もあるのだから千年程度
のデータでは記録にない地震には全く対処ができないという。

それだったら、万が一今自分がいる場所で仮に地震が起きたらちゃんと、
命を守れる行動をできる抗震力をつけるべきであるというのがこの本の主張
だった。

確かに、いつ来るかわからない地震というのは、一生遭遇しない可能性のほう
が高いわけで、気を抜きながら準備した気になっているよりも、最低限、地震や
津波が起きても命だけは守ると考えたほうが合理的なのだと思った。





最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月25日 04:41 ] 地球科学・天文学 | TB(-) | CM(0)

トコトンやさしい核融合エネルギーの本

現在の発電というと、水力、火力、原子力、自然エネルギーぐらいに大別され
る。

この中で、原子力発電というのはウランやプルトニウムといった大きな原子核
をもった原子を核分裂させて、そのときに出たエネルギーを使って発電してい
るのだが、放射性廃棄物が大量に出ることや、一度事故が起きると連鎖的に
爆発し暴走するため、危険性が高い。

これに対して期待されているのが、核融合発電である。

核分裂を利用した原子爆弾ができて、10年ぐらいで核融合を利用した水素爆
弾ができたのだから、核融合発電も同じように作れるのではないかと素人考え
に思ってしまうのだが、これが非常に難しく、早くできたとしても2050年以降に
なるらしい。

核融合発電では、二重水素(陽子1,中性子1)と三重水素(陽子1,中性子2)を
ぶつけて、核融合させヘリウムと中性子に分解された時にできたエネルギー
を利用するのだが、普通の環境下で二重水素と三重水素を混ぜても、原子核
同士が反応することはなく、反応させるためにはプラズマ状態にして、炉の
温度を2億℃にしなければならないという。

太陽でも核融合が起きており、1,500万℃でも反応するのは、太陽の場合
大きな重力なためで、地球上で再現できる圧力でやるにはやはり2億℃も
必要らしい。

こんな状態になると、炉が持たないので、プラズマを閉じ込めるために磁場
を使うらしい。

水素爆弾も、核融合を利用するが起爆させるのは原子爆弾による核分裂
反応を利用するという原理なので比較的実現が簡単だったが、永続的に
エネルギーを放出するのはこんなにも難しいらしい。

これが実現すれば、エネルギーなど半永久的に使えるようになるがめ、エネ
ルギー不足が一気に解決されるのだが、核融合反応で出る中性子というのは
放射線であるし、原料となる三重水素も中性子がβ崩壊しヘリウムになるの
でこれについても放射線が出る。

これらは、核分裂で発生する放射線よりも少ないし、また核分裂のように制御
不能に陥ることはないので核分裂を利用した原子力発電よりもかなり安全な
のだが、放射線が出るというだけでアレルギーのある人に対して説得するのは
難しいだろうと思った。



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月23日 04:22 ] その他工学 | TB(-) | CM(0)

理系あるある

理系の人間ならありがちな話について、あるあるネタとしてまとめられた本。

私は、こういうあるあるネタについては、共感しないことのほうが多いのだが、
この本に書かれていることについては、おーある、あると共感することが多
かった。

素数にでくわすと喜ぶ、救急車のサイレンを聞いてドップラー効果と思う、
食品の成分表示をチェックするなどという行動は、私も無意識のうちにやっ
ており、この著者の文章の面白さも手伝って妙に親近感を感じた。

あと、ためになったというか、今後心がけたいなと思うのだが、測定誤差に
こだわる、標本の少ないアンケート結果を冷笑するといったことである。

数値について、例えばラクダは一度に134リットルの水を飲むと聞くと、一般
の人ならいっぱい飲むなーという感想を漏らすだけである。私も同じである。

しかし、理系の人間は、こういった数値には誤差があるものだと考え、有効
数字が何桁なのかと誤差にこだわる。

確かに、全てのラクダが134リットルの水を飲むのかというと、そんなことは
ないとちょっと気をつければ、考えが至るが、そういうところまでは意識し
ないものである。

でも、ラクダは一度に(130±10)リットルの水を飲むといったほうが正解だ
と思うし、有効数字にこだわることは大事だと思った。

あと、標本数の少ないアンケートを冷笑するというのは、確かに私もそうなの
だが、ポアソンゆらぎ(*)という言葉を使った解説があり、ためになった。

これで、統計データを見るときにはこのポアソンゆらぎの範囲なのかどうかと
無意識のうちに計算してみてしまうのだろう。

*ポアソンゆらぎ
平均値がNなら、√Nは変動するという意味。
例えば平均値が4だとしたら、√4つまり平均から前後2は揺らぐので、平均値
が4の統計に2や6の数字が出てきても、ただちに平均値が変わったと考える
のは早計であるということ。



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月16日 04:53 ] 数学 | TB(-) | CM(0)

父親として知っておきたい理科の常識

子供が父親に理科的な質問をしてきたとき、その質問にちゃんと答えらえるように
することが目的で書かれた本。

・どーして、夏は暑いの?
・どーして、テレビは映るの?ラジオは聴けるの?
・どーして、ICカードで改札を通れるの?
・食べ物が腐るって、どういうことなの?
・どーして寒くなると風邪を引くの?
・どーしてわたしはさそり座なの?
・カロリーって、何の単位なの?
・どーして金メダルは石と違ってピカピカなの?
・どーしてあたしはパパと似てるの?

といった質問を子供がしてきて、パパがその質問に答えるといった形式で
記載されている。

私も理系本を読んでこのブログに記事として書いているので、平均的な理
系のおじさんよりも、こういった質問に答えられる自信はある。

夏が暑い理由や、冬に風邪を引く理由、子供が父親に似る理由なら、誰で
も答えられると思うが、金メダル(金属)がピカピカな理由やICカードで改札
が通れる理由などちょっと踏み込んだ理系の知識が必要な質問にも一応
答えることができる。

ただし、これは相手が大人だったらの話で、子供相手で、しかも正確に答え
ようとすると結構難しいと思う。

この本でも、親子の会話を通して父親が解説しているものの、内容は大人
向きの解説だった。
子供にもレベルがあるので、小学校1年生の質問と中学校3年の質問では
答え方が違ってくるし、小学校1年生向けの解説の本など大人が読んでも
面白くないのでこういう内容になるのはやむを得ないのだろう。

しかし、大人が知識を得るうえで、子供がしそうな素朴な疑問に対してちゃん
と解説されているので、なかなかためになる本だった。



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月12日 04:07 ] 物理 | TB(-) | CM(2)

明るさの物理量2(ルーメンとカンデラとルクス)

明るさの単位として、ルーメン、カンデラ、ルクスという単位がある。

ルーメンを光束、カンデラを光度、ルクスを照度というが、これだけ言われても
いまいちピンとこない。

わかりやすくするためには、これらを図示すると良いが、図で書く場合、ルー
メンを全方向に放射される光の総量(全光束)ととらえるか、単位立体角(1
ステラジアン)に放射される光の量ととらえるかで違う図になってしまう。

次の図(図1とする)がルーメンを全光束ととらえる場合である。
lumen1.jpg

ルーメンを全光束ととらえると、ルーメンを表す光源は量をイメージされるのに
対し、カンデラを表す円錐はそこを照らしている光の密度を指してしまっている
ため、個人的には直感的な図ではないと思う。

これらの関係を紹介するサイトを色々と見てみたが、サイトによっては全光束
のことを光束としていたりして、説明者自信がよくわかっていないのではない
かと思ってしまう。(読む方はもっと混乱する)


次の図(図2とする)がルーメン国際単位系 (SI)をベースにイメージした
ものである。
lumen2.jpg

この時、カンデラがその光自体の強さを表し、ルーメンは照らされた円錐自体
が量のイメージになるので、個人的には直感的である。

あとルクスは、照度で光から1m離れた場所から照らした平面の明るさは、
2m離れた場所から照らした平面の明るさの1/4、
3m離れた場所から照らした平面の明るさの1/9
となる。

明るさと面積が比例していることがわかる。

ちなみに、ルーメン、カンデラ、ルクスの関係は以下の通りとなる。

[lx] = [lm] / [m2]
[lm] = [cd][sr]

lm:ルーメン、cd:カンデラ、lx:ルクス、sr:ステラジアン

ステラジアンについては以前ブログに書いたとおりの単位である。

ラジアンとステラジアン
http://yama2190.blog.fc2.com/blog-entry-2343.html


最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月09日 04:09 ] 物理 | TB(-) | CM(0)

明るさの物理量1(ルーメンとワット)

電球など滅多に買うものではないが、先日電球を買うことがあった。

最近は昔ながらの白熱電球はあまり売っておらず、電球コーナーの売り場面積
はほとんどLED電球で占められていた。

白熱電球の場合、100Wという単位が明るさの単位で書かれていたのに対し、
LED電球をみると「100W型相当」という表示がされて、併記される形で、
「明るさ(全光束)1,550lm」と書かれたりする。

Wは皆様おなじみのようにワットと呼ぶ。lmはルーメンと呼ぶ。

他にも、自転車のライトの明るさはcd(カンデラ)という単位が使われていたり
する。

明るさについて、Wやら、lmやら、cdなどいろいろな単位がありよくわからな
くなってきたので調べることにした。

Wは仕事率であり、必ずしも明るさを表す単位ではない。

電球やLED電球では消費電力を示しているが、効率も違うため、同じ明るさで
も消費電力が異なる。

消費電力を明るさの単位にするのは無理があったが、長い間消費電力の単位
を明るさの単位として使ってきたこともあり「W相当」という単位が出てきた。

また、LED電球が市場に出始めたころは、このW相当の基準が定めらていな
かったため、各メーカーが独自に基準を定められていた。

白熱電球は形がほぼ球形なのに対し、LED電球は必ずしも球形ではなく一方
向のみを照らしたりするものがあり、100W相当といっても真下の明るさだけ
をもとにしたりして、白熱電球と比べて暗いということで問題になったことがあ
り、別の全光束のルーメンという単位で統一される異なったのである。

またルーメンという単位は、ワットとは違い、ヒトの視覚が感じる度合いが考慮
されるので、波長毎に重み付けされたものである。
(同じワットでも波長λ=555nmの緑色の光が一番明るく感じる。)

(そういえば2010年のエンベデッドシステムスペシャリスト試験の午後1の問3でも
 この手の問題が出てたな。)


最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2017年05月08日 04:11 ] 物理 | TB(-) | CM(0)
カテゴリ

openclose

プロフィール

旅好きおやじの日記

Author:旅好きおやじの日記
職業はIT関係です。
趣味は海外旅行(22カ国制覇)、読書、資格取得です。
取得した資格は以下のとおりで、半分趣味のようになってます。

・情報処理
 ・ITストラテジスト
 ・システム監査
 ・プロジェクトマネージャ
 ・アプリケーションエンジニア
 ・テクニカルエンジニア(システム管理)
 ・テクニカルエンジニア(データベース)
 ・ネットワークスペシャリスト
 ・エンベデッドシステムスペシャリスト
 ・情報セキュリティアドミニストレータ
 ・情報処理一種
 ・情報処理2種
 ・情報セキュリティマネジメント
 ・ITパスポート
・元PMP
・ITIL V3 Foundation
・Oracle Master Gold
・日商簿記1級
・建設業経理士1級
・英検2級

最新記事
カレンダー
プルダウン 降順 昇順 年別

10月 | 2017年11月 | 12月
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 - -



ブクログ
楽天
アクセスランキング
[ジャンルランキング]
日記
817位
アクセスランキングを見る>>

[サブジャンルランキング]
会社員・OL
171位
アクセスランキングを見る>>
検索フォーム
人気ブログランキング
ブロとも申請フォーム