エビデンスで教育を考えた

頭が良くなる科学論文を紹介していきます。お勧め商品は楽天ルームで!https://room.rakuten.co.jp/room_12b7a40f6d/items

データサイエンスの歴史を振り返ろう①概略編

 2003年にデータの洪水という言葉が使われてから早20年。
そろそろデータサイエンスの知見が溜まってきたので(人類的に)、ここいらで歴史を振り返りたいなと。

というのも、私自身がデータサイエンスの世界に放り出された身なので、データサイエンスがどのように発展していったのかがいまいちわからないまま徒手空拳でやってるというのがありまして笑。何が幹で何が枝葉なのかを整理したんですよね。

というわけで今回はデータサイエンスの歴史の話。(いつものように加筆予定です。)

概略編

「データサイエンス」という言葉が使われたのは1974年のナウアさんの著書が初。[ナウル 1974]

ここでの定義はデータを扱う科学としてデータサイエンスという言葉を使ったみたいです。意外に古いですね。もちろんこの頃にはまだpythonもなければディープ君もない時代。その意味でこの著書はほぼほぼ予見みたいな立ち位置だったものと思われます。

 時を同じくして使われていたのはデータ処理や探索的データ解析という言葉。データ処理は1968年[Morrell 1968]で探索的データ解析は[Tukey 1977]に使われております。
 探索的データ解析はいわゆるEDAというやつでして、データサイエンスをする際にはデータ理解をしたり分析方針を決めるための大事なステップの1つ。当時はデータ理解というより、もっと踏み込んでデータから新しい知識を発見しようという意味合いの方が強かったみたい。ここからデータマイニングなんという言葉が出てきて今日のデータ分析(データアナリシス)に結びついているんすね。

 80年代になるといよいよ記述統計学と本格的に結びついてくるようです。[Stewart and McMillan 1987]では「記述分析」という言葉が使われています。以下引用(記述分析とはデータサンプルやセットの特徴や測定値を定量的に要約したり記述したりするものである)ここからデータマイニングという言葉も出てきます。データマイニングとはデータから隠れた興味深い知識を発見するプロセスのこと。先のEDAと似た概念ですね。



※薬が切れて花粉症が再発しました。結果寝不足になりうまく書けない日々が続いてます。続きは必ず書きます!