データ分析の基本と業務

自分の仕事で使うデータ分析といっても、平均や加重平均、あとはせいぜい
散布図でプロットを打って、相関分析や回帰分析(最小二乗法)する程度しか
しないので、この本に書かれている他の基本的なデータ分析の手法と活用例
は参考になった。

数学で習った相乗平均こと幾何平均は時系列のデータを使って成長率を計
算で使うことや、聞きなれない調和平均は交流回路の抵抗値の計算で既に
知っているという話とそれだけでなく仕事の生産性の分析をする際に役に立
つことなど、分析の活用例が載っていることがよかった。

あとは、大学で習ったはずだがさっぱり忘れている、主成分分析もEXCEL
の機能であるソルバーを使えば、複数の属性、例えば学校の科目の英語、
国語、数学、理科、社会といった点数から、生徒の得意な傾向が、英語、
国語、社会という文系科目が得意な生徒と、数学、理科といった理系科目
が得意な生徒が出てきて、主成分に文系科目、理系科目とあぶりだせる
ことができ、これがマーケティングでの傾向分析に役立てることができる
などがわかった。

あと、データマイニングの手法として、同時に起こる可能性の高い現象の
組み合わせを見つけるアソシエーション・ルールでは、マーケティングの
世界でよく言われるビールの売れ行きからいっしょに紙おむつが買われて
いるというのを見つけることができたり、次の行動を予測するシーケンスと
いう手法では、顧客の年齢や性別によって次に買うものを推測できるので、
メールマガジンで商品を紹介するといったことができるという。

他にもいろいろと紹介されていたが、私ぐらいのデータ分析しか仕事で使っ
ていない人が読むにはちょうどいい本だった。




最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
スポンサーサイト
[ 2016年08月26日 04:47 ] 数学 | TB(-) | CM(0)

「P≠NP」問題

数学上の未解決問題のうち、解いたら100万ドルの懸賞金が与えられると
いうミレニアム懸賞問題といものがあり、有名なリーマン予想と共に、難問
に挙げられるP≠NP予想というものがある。

P≠NPが何なのかを知るためには、グラフというものを知る必要がある。

グラフとは点と辺でつないだものをいい、以下の様なものである。
graph_201605.jpg

グラフの中で、すべての辺を1回だけ通る道をオイラー路という。
いわゆる一筆書きできるかというものである。
上に挙げたグラフでは一筆書きできないのでオイラー路はない。

次に全ての節点(赤い点)を1回通る道をハミルトン路という。
上のグラフでは赤い点を1回だけ通る道は簡単に見つかるだろう。

どちらもアルゴリズムなど駆使しなくても解けるか解けないかが簡単にわかる
問題である。

これが次のようなグラフになってくるとどうだろうか?
O_44.gif

これはそう簡単にはわからないだろう。

アルゴリズムには、計算量という概念がある。

計算をする対象の数、ここでいう辺とか節点の数をnとした場合、その
計算量がn2とか、n3で解けるものを多項式時間といい、
計算量が2nとか、3nで解けるものを指数関数時間という。

この2とか3とかいう数が10とか20とかになってくると、指数関数時間の
アルゴリズムは爆発的な計算量が必要になる。

一筆書きのオイラー路の計算のような計算は多項式時間の計算量なので、
P問題のひとつである。
ハミルトン路の方は、多項式時間の計算量かどうかは不明だが、
答えが与えられていたら簡単だという問題に分類され、NP問題のひとつ
である。

解がある問題(NP問題)ではあるが、それが全て多項式時間で求められる
問題(P問題)なのかどうか?恐らく、P≠NPのものもあるだろうという予想が
立てられているが、それが正しいかどうか証明されていない。

これが、もし、証明されていたら、素因数分解の複雑さを利用したような
暗号化のアルゴリズムも何らかの工夫をすれば見つかるということを意味し、
それが見つかっていないのだからP≠NPだと考えられている。


以下の本を読んだが、この本は冗長な解説である最初の100ページを
読み飛ばして読むと何となく、雰囲気をつかむことができた。




関連記事
組合せ爆発とおねえさん(2015/8/11)
http://yama2190.blog.fc2.com/blog-entry-1707.html



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2016年05月27日 04:33 ] 数学 | TB(-) | CM(0)

99.996%はスルー

図書館においてあった本。タイトルを見ると、情報に関する本だろうなと
薄々思いながら何の本か興味があったので借りてみた。

主語がないので、何の99.996%がスルーなのか、タイトルではわからな
いが、本を読んでみると、2009年時点のインターネットにおける情報の
流通量に対する消費量がたった0.004%とのことであった。

でもよく考えると、この消費量というのも同じデータが何回もインター
ネット上を流れているだろうから、実際はそれよりも少ないことになる
のではないかと思う。

ちなみに、人間の脳のスルー度合いというのは、インターネットの
流通量に対する消費量どころの騒ぎではなく、知覚した情報の
100万分の1しか消費していないらしい。

目に映ったものや、耳で聞いたもの全てを脳で知覚していては、あっ
というまに脳がパンクするから、こういうスルーする能力が備わった
そうで、大事な情報だけを受け取れる生物特有の感覚というのが
あるため、コンピュータと比べても、まだまだ人間は優秀であるとの
ことである。

あと、この本を読んで情報量の意味がよくわかった。

昔の情報処理試験とかでは、無機質に情報量は-log2Pと覚えたが
何がいいたいのかよくわからなかったが、この情報量という単位は
その情報の価値を表し、P(発生確率)が低いほど、情報量は大きく
なり価値のあるものであることを示していることが理解できた。





最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2016年05月05日 04:19 ] 数学 | TB(-) | CM(0)

面積の発見

現代人は、当たり前のように「面積」を使って生活している。

家の面積とか、田んぼや畑の面積、あまりに広い面積の場合、
東京ドーム何個分とか言って、余計広さがわからなくなるような表現を使ったり
する。

そんな面積は、小学校の時に縦×横で計算すると習う。

そういうものだと教えられる。

では、面積はなぜ縦×横なのか?

そういうものだから、そう定義しているから、という答えが返ってきそうだが、
そこで話を終わらせては面白くないと思うので、本で調べて深堀りしてみた。

面積という概念は、4大文明それぞれで発生したが、農作物の耕地とか、
そこで働く労働を量で表すために、単位長さを決め、その単位長さで作った
正方形を単位面積として面積を測ったということである。

農耕から必然的に必要になる概念なので、モンゴルの遊牧民の間では
発見されなかったというから、やはり量というのは必要があるから定義
されるものであると、改めて思った。



最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2015年09月01日 04:01 ] 数学 | TB(-) | CM(0)

組み合わせ爆発とおねえさん

コンピュータのネットワークにおいて、点と点を結ぶ経路は、点を増やしていく
と急激に増大する。

このことを組み合わせ爆発という。

このことを小学生にでもわかるように説明した面白いアニメを見つけたので
見て欲しい。



アヤパンににたお姉さんが、1×1の格子の対角の2点の経路の説明から
はじめ、2×2、3×3と格子の数を増やしていけばどうなるかを解説するの
である。

最初のうちはて計算で十分解けたのだが、コンピューター、スーパーコン
ピュータを使っていくのであるが、オチがすごいことになるのである。

おねえさんの根性恐るべしといったところなのだが、これもアルゴリズムを
見つけて今では短時間で解けるというのである。

アルゴリズムつながりで…

暗号化のアルゴリズムなども、簡単に解ける方法が見つかってしまうと、
そのアルゴリズムは暗号化ロジックの意味がなくなる。

過去にもDESという名前の暗号化ロジックがあったが、今では簡単にやぶら
れるようになった。

今主流のアルゴリズムも、別の効率的なアルゴリズムが見つけられると
と考えると、大混乱が起きるのかもしれない。

最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2015年08月11日 04:04 ] 数学 | TB(-) | CM(2)

マンガ おはなし数学史

久しぶりに読んだ数学の本であるが、タイトルのとおりマンガである。

マンガだからといってバカにはできず、なかなかわかりやすい本だった。

学校では数学を公式とか無味乾燥な教え方しかしないが、マンガを通して
数学のニーズがあった時代にタイムスリップし、時代背景ととともに説明
してくれていた。

大砲戦の弾道から二次関数や三角関数が、何年に何人死んだという
死亡表と交易量の関係から統計学が、バクチから確率論が生まれた
などの解説がされていた。

マンガも、手塚マンガのような面白い描かれ方をしており、理解が進んだ。

同じシリーズで、物理学史や科学史などの本もあるようなので、図書館を
探してみたいと思う。




最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2015年08月05日 04:28 ] 数学 | TB(-) | CM(0)

江戸時代の数学

数学という学問は、開国、明治維新後に日本に入ってきたものである。

日本が開国後、短期間で列強の仲間入りができたのも、庶民のレベルで
も寺子屋で読み書きソロバンの教育ができていたからと言われているが、
庶民のレベルだけではなく、学者のレベルが高かったということは割と知ら
れていない。

以前、このブログで、線形代数の話をしたときに、江戸時代の和算家、
関孝和の話をした。

線形代数では、行列という考え方がある。
この行列は、最近は高校で習わなくなったということで物議を醸しているらし
いが、理系であれば確実に習うものである。

この行列の中に行列式というものがあるが、この考え方はフランスのサラス
が考えだしたとされているが、日本の和算家である関孝和はその150年も前
に編み出していたものである。

この行列式以外にも、円周率も独自の計算方法で計算していたようである。
(参考:Wikipedia「円周率の歴史」)

関孝和は当時最先端を行っており、西洋ではニュートンやライプニッツと
同じ時期に、彼らとは全く交流のないところで、独自に微積分の分野で世界
最高水準に達していたというし、ベルヌーイ数という、連続する整数のべき乗
和をベルヌーイよりも10年前に見つけていたりするのである。

ただし、江戸時代の数学は学術的に体系化できていなかったこともあり、
実用的ではなく、趣味の世界で発展したという側面が強かったので、
明治維新で西洋文化が入ってきた後、廃れてしまったというのである。

ただし、こういった物事を考える力というものはもともとあったので、
明治維新により爆発的に日本が発展したのかもしれない。


最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2013年09月15日 04:55 ] 数学 | TB(-) | CM(0)

リーマン予想の探求

少し前にNHKスペシャルの「素数の魔力に囚われた人々」という番組を見て、
リーマン予想というものが何なのかを知った。

リーマン予想とは、数学の未解決問題の中でも、難問中の難問に位置付けられ
ている。
(説明については以前のブログの記事に譲る)

この本は、1ページあたりの文字数が少なく、かつ、高校数学で習わないような
特殊な数学的な記号も総乗を表す記号のΠと、両辺がx→∞の時両辺の比が1に
近づく記号の~ぐらいしかないため見かけは簡単で、かつ、151ページという薄い
本ではあるのだが、書いていることはとてつもなく難しい。

著者は、日本の数論の大家、黒川重信さんである。

本の中で最初に登場する、「素数が無限個あることの証明」についての書き方か
らして難しかった。

この本では、素数は無限個あることの証明として

「素数が有限個p1,p2,p3,…,pnしかないとする。そのときp1×p2×…×pn + 1の
 素因数分解を考えると、素数p1,p2,p3,…,pnのどれかで割り切れないとおかしい
 ことになる。
 しかしどれで割っても1余る。これは矛盾。したがって素数は無限個ある。」

というような記載があったが、ピンと来なかった。

もっと、素人にわかりやすい説明はないものかとググってみると、
p=p1×p2×…×pn + 1(p1,p2,…,pnは全素数)
とした場合、pは1と自分しか約数を持たない素数なので、pはpnよりも大きい素数
なので矛盾するという背理法の証明が乗っていた。
pがなぜ素数になるのは依然として分からなかったが、説明はこの本よりもわかり
やすかった。

そんな感じで、グーグルを併用しながら調べて理解できたのはここまでで、それ
以降は、代数学の「群・環・体」をちゃんと理解していないと全く歯が立たない
感じだった。

リーマン予想については、有理数体版のリーマン予想はまだ解けていないのだが、
関数体版のリーマン予想は解決していることが巻末に載っていた。

他にも、絶対数学、abc予想について解説されており、雰囲気はわかったが、
理解は全くできなかった。

ちなみにabc予想は、互いに素でありかつ a + b = c を満たすような三つの正の整
数(この予想に呼び方を合わせるとa, b, c)について述べているもので、
これができて何がうれしいのか、サッパリわからないが、これが証明できれば、
数学のフェルマーの定理も当たり前のことになるとのことである。

整数など研究して何が面白いのかと最初は思ったが、奥が深い学問であると
感心させられた。




最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2013年04月12日 04:32 ] 数学 | TB(-) | CM(0)

素数の魔力に囚われた人々 後編

昨日に続いて、素数とリーマン予想の話である。

このリーマン予想に当時の数学界のエース、解析数論のハーディーとリトルウッド
2人組が挑んだが、証明できず、あえなく惨敗。

その後、映画「ビューティフル・マインド」の主人公で、ゲーム理論のナッシュ均衡で
有名なナッシュは、リーマン予想が正しいと仮定した世界を作り、それが現実の数学
の世界であるということを証明するという形で証明しようとしたのだが、同じ時期に統
合失調症を患ってしまったのである。

次に、アルゴリズムと計算の概念を定式化し、コンピュータの発展に大きな影響を
及ぼしたチューリングは、ゼロ点が直線からずれているところに一つでも存在すれ
ば、リーマン予想自体が間違っていることを証明できると挑んだが、1000個以上
のゼロ点が一直線上に存在することを確認するだけで結局はその反証も失敗に
終わった。

この、数学者たちだけで研究されていた素数であるが、リーマン予想を研究してい
る数学者が、偶然、知人からある量子物理学者に引き合わされ、その量子物理学
者に、ゼータ関数のゼロ点の間隔についてなんとなく話したところ、量子物理学者
が、原子核のエネルギー間隔を表す式とそっくりだということがわかったという。

話は、横道にそれるが、150桁を超える素数はインターネットなどの暗号化に使わ
れているという。要は大きな素数は素因数分解するのに時間がかかるので、暗号
化の道具になり、商品として扱われ、現代社会では無くてはならないものだという。

もし、リーマン予想が解決されれば、原子核のエネルギー間隔やそれより小さな
素粒子の謎が解明され万物の原理が解明される可能性があり、かつ、今世の中
で使われている暗号化の技術が一挙に無効化してしまう非常に恐ろしい事態に
なると、番組で入っているのである。(多少誇張はあるが)

このドキュメンタリーをみて、リーマン予想の概要はよくわかった。
整数論の世界が、複素関数の高等な部類のゼータ関数のゼロ点の配置の証明
という形で与えられ、それが素粒子や超ひも理論にも影響しているとは夢にも思
わなかった。
こういう難しい数学の問題を素人にもわかりやすいように解説してくれる、NHKの
良質な番組作りに感心させられた。

リーマン予想については、もう少し文章で読みたいので図書館で一冊借りてみた
いと思う。




最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2013年02月26日 04:15 ] 数学 | TB(-) | CM(0)

素数の魔力に囚われた人々 前編

NHKで2009年に放送された「素数の魔力に囚われた人々」という番組を見た。

理系の人間として、非常に面白く見ることができた。

小学生の時に、素数について学んだ。

念のため、素数について解説すると、1とその数以外に約数がない1ではない自然数
を言う。

具体的にいうと、2,3,5,7,11,13,17,19…と無限に続く。

この素数は、規則性がなく並んでいる。
自然数を1つ1つカウントしていけば、2つか3つぐらいの間隔で素数がボンボンと現れ
る場合もあれば、80個ぐらい素数が現れない場合もあるという。

このような無秩序な素数の規則性の証明について、数々の天才数学者が挑んでおり、
ことごとく破れているというのである。

まず、e=-1を発見したオイラーである。

彼は素数についてある発見をした。

素数を使って

22/(22 - 1)×32/(32 - 1)×52/(52 - 1)×72/(72 - 1)・・・が、π2/6であることを発見した
のである。

これで、素数が無秩序ではない数であるのではないかということを示唆しているので
ある。

その後、ガウス平面のガウスは、素数をその自然対数で割った商はその素数が大き
くなればなるほど、その数が何番目の素数かということと商が一致してくるというので
ある。
πだけではeにも関係するということで、ますます秩序がありそうだということが、わかっ
たのである。

次に、ようやくリーマンが出てくる。
リーマンは、 素数の規則性の証明をすることを
「ゼータ関数のすべての零点は一直線上に分布する」
という命題に言い換える。これをリーマン予想というが、これが数学の難問として、未だ
解き明かされていない問題だというのである。

ここで、ゼータ関数とはなんぞやというと、

2x/(2x - 1)×3x/(3x - 1)×5x/(5x - 1)×7x/(7x - 1)・・・
と、オイラーが最初に使った関数の2乗をx乗に置き換えたものであるという。

NHKでは素人にもわかりやすいように上の式で説明してくれていたが、ぐぐってみると
もう少し難しい数学(複素関数)を使った、次の式が一般的なようだ。


(Πは相乗の記号。Σ(総和)の掛け算版)

この関数の0の点がすべて一直線上に並ぶというリーマン予想の証明を、数多く
の天才数学者たちが挑んでみんな敗れ去ったというのである。

後編へ続く




最後まで読んで頂きありがとうございます。こちらを押していただけると嬉しいです!!
↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓↓
にほんブログ村 オヤジ日記ブログへ
[ 2013年02月25日 04:23 ] 数学 | TB(-) | CM(0)
カテゴリ

openclose

プロフィール

旅好きおやじの日記

Author:旅好きおやじの日記
職業はIT関係です。
趣味は海外旅行(21カ国制覇)、読書、資格取得です。
取得した資格は以下のとおりで、半分趣味のようになってます。
情報処理(ITストラテジスト,システム監査,プロジェクトマネージャ,アプリケーションエンジニア,テクニカルエンジニア(システム管理),テクニカルエンジニア(データベース),ネットワークスペシャリスト,セキュリティアドミニストレータ,1種,2種)、元PMP、ITIL V3 Foundation、Oracle Master Gold、日商簿記1級、建設業経理士1級、英検2級

カレンダー
プルダウン 降順 昇順 年別

03月 | 2017年04月 | 05月
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 - - - - - -



ブクログ
楽天
アクセスランキング
[ジャンルランキング]
日記
786位
アクセスランキングを見る>>

[サブジャンルランキング]
会社員・OL
157位
アクセスランキングを見る>>
おやじ日記ランキング
検索フォーム
人気ブログランキング
ブロとも申請フォーム