matsuyuta's Room

データの活用を考える

       
  • 2009年 1月 23日 · カテゴリー: データ、情報との付き合い方;
    このエントリーを含むはてなブックマークはてなブックマーク - データの持ち方 このエントリをつぶやくこのWebページのtweets Bookmark this on Delicious この記事をクリップ!Livedoorクリップ - データの持ち方 BuzzurlにブックマークBuzzurlにブックマーク Share on Tumblr FC2ブックマークへ追加 Yahoo!ブックマークに登録 Googleブックマークに追加

    データは、データベースやExcelファイルなど電子データにしておくのがよいです。紙媒体のデータは迅速に電子化すべきです。データを他人に渡したくない場合、「データが紙媒体しかなく、手元にない」みたいなことを言って断わります。角のたたない断り方のひとつ。
    データの持ち方、つまり、とっておき方ですが、使う用途があるからとっておくわけで、使いたいときに使いやすい形でとっておくのがよいです。
    使い道が決まっていない場合は、なるべく加工しない状態(集計はせず、最もデータが細かい単位)でもっておき、使うときに使いたいように加工するのが一番です。
    また、データを取っておくときに注意したいデータがあります。
    ・年齢
    ・回数(カウント)
    たとえば、「年齢」というデータです。年齢は毎年増えていくものですので、データ取得年月日データを一緒にとっておかなければなりません。
    現在の年齢=年齢データ+(現在年月ーデータ取得年月)
    この場合「生年月日」のデータを持つのが正解です。他にも、商品の使用年数などは、購入年月日でもつことが必要になります。
    「回数」のデータも工夫が必要です。
    「回数」のデータは、条件にあうデータ(レコード)が何件あるか(カウント)数えた集計値であり、その都度、集計すればよいので、「回数」というデータは持たないというのが、基本です。
    たとえば、「購買回数」、「問い合わせ回数」など。
    できるだけ集計しない状態でデータをもつことが基本です。
    以下、引用。
    分析用データ(データウェアハウス)の4つの特性
    1、サブジェクト指向  使いやすいように目的別にデータを揃える
    2、統合    一元管理やデータの細かさがそろっているなど
    3、時系列性  どのタイミングでとられたデータかは必須情報
    4、恒常性   データを更新しない。時系列で蓄積していくイメージ
    (~「よくわかるデータウェアハウス」日本実業出版社 2000年 より)

    コメントは受け付けていません。
 
Get Adobe Flash playerPlugin by wpburn.com wordpress themes