matsuyuta's Room
データの活用を考える
-
2009年 1月 23日 · カテゴリー: データ、情報との付き合い方;コメントは受け付けていません。
データは、データベースやExcelファイルなど電子データにしておくのがよいです。紙媒体のデータは迅速に電子化すべきです。データを他人に渡したくない場合、「データが紙媒体しかなく、手元にない」みたいなことを言って断わります。角のたたない断り方のひとつ。
データの持ち方、つまり、とっておき方ですが、使う用途があるからとっておくわけで、使いたいときに使いやすい形でとっておくのがよいです。
使い道が決まっていない場合は、なるべく加工しない状態(集計はせず、最もデータが細かい単位)でもっておき、使うときに使いたいように加工するのが一番です。
また、データを取っておくときに注意したいデータがあります。
・年齢
・回数(カウント)
たとえば、「年齢」というデータです。年齢は毎年増えていくものですので、データ取得年月日データを一緒にとっておかなければなりません。
現在の年齢=年齢データ+(現在年月ーデータ取得年月)
この場合「生年月日」のデータを持つのが正解です。他にも、商品の使用年数などは、購入年月日でもつことが必要になります。
「回数」のデータも工夫が必要です。
「回数」のデータは、条件にあうデータ(レコード)が何件あるか(カウント)数えた集計値であり、その都度、集計すればよいので、「回数」というデータは持たないというのが、基本です。
たとえば、「購買回数」、「問い合わせ回数」など。
できるだけ集計しない状態でデータをもつことが基本です。
以下、引用。
分析用データ(データウェアハウス)の4つの特性
1、サブジェクト指向 使いやすいように目的別にデータを揃える
2、統合 一元管理やデータの細かさがそろっているなど
3、時系列性 どのタイミングでとられたデータかは必須情報
4、恒常性 データを更新しない。時系列で蓄積していくイメージ
(~「よくわかるデータウェアハウス」日本実業出版社 2000年 より)




