データサイエンスの出発点は何?

データサイエンスへの出発点は統計学とプログラミングです。統計学は記述統計学と推測統計学の基礎のマスターです。記述統計学はデータの取り扱い及び処理についての理論と方法を学びます。平均、分散、偏差などの概念を理解するところからスタートです。言葉を知っているのと統計的な意味で理解しているのは、別次元のことなので初学者に取ってはここが最初の関門です。これらの理解はヒストグラムの作成で計ることができます。ヒストグラム即ち棒グラフですが、自分で構成要素を積み重ねて作り上げることができるようになるには、要素の分析組合せが欠かせません。ベルーフでは日科技連方式のヒストグラムの作成をスタンダードとしています。推測統計学はAという状態とBという状態をデータをもとにして、帰無仮説による比較判断をするものです。例えば、生産物の品質が昨年と今年で向上しているかどうかを判断します。これによって品質向上の条件や対策の現状を評価することができます。統計学は数学よりも後発の学問です。アルファベットは既に数学の記号で使われておりますので、統計学ではギリシャ文字が記号として使われています。又、計算式も数学をベースにしながら、統計学独自のスタイルが作られています。ギリシャ文字と数式に慣れるのが統計学取り組みの出発点かもしれません。次回はプログラミングの出発点を取り上げます。 播磨守

コメントを残す

メールアドレスが公開されることはありません。