matsuyuta's Room
データの活用を考える
-
No Comments
たまたま見つけた動画
Gephiってソフトのプラグインの紹介みたい。
ブラウザでネットサーフィンするとブラウザでどのサイトにアクセスしているかグラフィカルに表示してくれる。
最近は、どのページもフレームやらJavaScriptやらでいろいろなサイトにアクセスして、
マッシュアップしてあるからそれが見れるのがおもしろい。私は、単純に「へー」って感じだが、技術的に詳しい人がみたら、もっと違う意味があるのかな。
◯簡単な使い方・手順
ソフトダウンロード 「Gephi」 http://gephi.org/
プラグインダウンロード 「HTTP Graph」 http://gephi.org/plugins/http-graph/ダウンロードしたプラグインファイルを
C:\Users\ユーザー名\AppData\Roaming\.gephi07beta\dev\ に移動。・Gephiの設定
Gephiを起動して 「new Project」をクリック
メニューバーの 「Tools」 の 「Plugin」 をクリック
「Download」タブの「add plugin」ボタンをクリック
でダウンロードしたファイルを選択
そして 「install」 ボタンをクリックしGephi再起動。
「File」メニューの「generate」→「HTTP Graph」を選択。
port番号を「8088」に指定。・Firefoxの設定
「ツール」メニューの「オプション」を選択し、「詳細」タブのさらに「ネットワーク」タブ
「接続設定」ボタンをクリックし、手動でプロキシを設定する
HTTPプロキシ「127.0.0.1」 ポート「8088」
(Gephiで設定したポートと同じにする)
OKボタンプロキシの設定時に、Windowsの警告や、エラーでるかもしれません。
セキュリティに関しては自己責任でお願いします。以上。
-
No Comments
「Facebookってどうよ?」と聞かれたらこう答えることにした。
「パスポートだ」
Facebookは、SNS(ソーシャル・ネットワーキング・サービス)のひとつなんだけど、
世界で圧倒的なユーザー数をもっているWebサービス。
機能的にはそんなに他のSNSと変わらないけれど、一番の違いは実名性であること。Webサービスってインターネット上に無数にあるんだけど、
使うとなると、アカウント作成して、ログインが必要になる。
これ、イッコイッコ登録していくの面倒だよね。
最近では、Facebookのアカウント持っていればそのアカウントで
Webサービスを利用できるようになってるわけ。WebサービスとFacebookが連携しているわけね。
この連携サービスは、twitter、googleもやってるんだよね。
でも、Facebookの方がWebサービスを提供する側からみるとメリットが高いよね。
だって、より正確な個人データを収集することができるんだもん。
Webサービス提供側がFacebook連携をどんどん採用していけば、
Webサービス使うには、Facebookアカウントなしには利用できなくなるってくらい、
いわゆる、社会的インフラみたいな役割、
インターネットでのパスポートみたいなもんになってくるわけよ。参考:
「UNIQLOOKS」
→このサービスはFacebookアカウントないと利用できないわけ。問題点:
「一人のはまちやはまちーは削除され、何百人の佐々木希は生き残るFacebook 」
→ これは困った。説明の辻褄があわなくなる。で、さらに、個人的に思うこと。
将来的には、個人データを個人で販売できるようになると思うわけさ。
布石は打たれてる感はあるね。Facebookポイント
電子マネー(モバイル)
→GPS対応のモバイル機器であれば位置情報までわかってくる。購買情報は、小売店(ECを含む)かクレジット会社の独壇場だったんだけど、
Facebookポイントを使ってモバイル機器(ICカード)から買い物できるようになれば、
購買情報はFacebookが収集できるよね。ここで、Facebook上の購買情報の優位性は、
複数店舗での購買履歴を串刺しにして見れることと、位置情報になるんじゃないかと思う。
いわゆる、購買&行動の履歴ね。
そして、ここに広告(リアルタイム連動)が入ってくると、かなりレスポンス効果が生まれるわけ。
カネの匂いがプンプンしてきたね。
自分のデータを世界中に売ることができるようになるんだね。
ひとりひとりのデータの価値は小さいかもしれないけれど、
「塵も積もれば山となる」世界中を巻き込めば、いったいどうなることやら?未知の世界にワクワクするね。
実現方法的なことについて、考えてみた。
こんなこと言っても、まぁ、用心深い日本人はじめ様々な人が
セキュリティに関してリスクを感じるかもしれない。「データを売る」って言っても、すべてのデータを公開しなきゃいいわけよ。
データ分析する側も、個人名の分析なんか(多分)しないから、
属性情報(個人が特定されないモノのみ)と購買情報・行動履歴情報を売りに出せばいいんじゃない?
Facebookで集計データにして渡せばいい。
Facebookが実在する人間かどうかを確認さえしてくれればいいわけ。
怪しいデータもあると思うけど、その場合はランク付けでもして、
データの販売価格に差がつくようにすればいいよね。(ちなみに「UNIQLOOKS http://uniqlooks.uniqlo.com/」では、生年月日データを抜かれたけどね。)
企業側だって、その方が扱い易いんじゃない?
まぁ、Facebook側の負荷はかかるけど。これは無理かな?
以上。
ちなみに後ろの方は、妄想だね。
相手の興味に応じて、最初のほうだけの説明で、切上げることもある。 -
No Comments
経済省の統計利活用サイト 「データボックス」が開設された。Flashが使用されていてグラフがダイナミックに操作できて面白い。評価、コメントが投稿できる。コメントに大しての評価、コメントもできる。ソーシャルメディア的な要素が増えてきたと感じる。よいことだ。
データは、PDF、EXCEL、XMLのデータが検索できるようになっているが、今のところXMLのデータは見当たらない。APIの公開(API公開開発室)などもされるのだろうか?今後、まだまだ、新しい機能が追加されるらしいので期待したい。このシステムのデータを利用したサービスやアプリが一個でてくると活用の仕方にイメージがつきやすい。というか、簡単なサービス、アプリを一緒に公開して、「こんなことできますよー。」といったアプローチがあるといいのになぁ。
参考:
経済省の統計利活用サイト データボックス
API公開開発室
オープンガバメントラボ追記 2010/10/06
このグラフは、Pentahoでだしてるんですねぇ。
記事:「経済産業省、統計情報の活用検証サイト「データボックス」にPentahoを採用」 -
No Comments
・ソーシャルメディアのデータのオープン化
・IFRSなどの企業データのデジタル化、定型化
・Web上の分散システム構築形態とデータウェアハウス、ビジネスインテリジェンス(以下、DWH、BI)運用形態の適合性といった要素を考えたとき、オープンプラットフォームという名のデータウェアハウスが
知らぬ間に構築されつつあるのではないかと感じている。twitterをはじめ、様々なソーシャルメディアが、
オープンプラットフォームという名で
システムやデータを
誰でも(?)自由に利用できるようになり、
個人の属性情報、意見、位置情報、画像・動画など
大きなくくりで言うと顧客情報があふれている。また、国際会計基準IFRSでの会計報告が義務化される中で
インターネット上でアクセスできるデータは、
より公的に信頼できるモノになっている。DWH、BIというシステム分野に関していうと、
一昔前までは、分析する情報は、企業社内のデータベースにあり、
秘密情報であるため、Web上でシステムを構築することなど
あまり考えられなかった。
だが、今のように、活用できる情報がインターネット上にあふれてくると
Web上でのDWH、BIの構築が現実味を帯びてくる。また、分散システムも実用レベルになってきており、
GoogleAppEngineなど、システムの利用度合いで課金されるようなシステム利用形態は、
分析によって、データ量や処理量が変わるDWH、BIの運用形態にぴたりあてはまる。「重要な変化」が起きているのだ!
-
No Comments

Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本
Michael Milton,大橋 真也(監訳),木下 哲也オライリージャパン
売り上げランキング : 91026データ解析の流れを感じるには良い本かもしれない。
実際には、データ分析で短期間で結果がでるものではない。
トライアンドエラーで精度を高めていくものである。
システムを構築して、システムとデータを使いこなし、解析を行う人間が成長する。
コンピュータリテラシーではなく、情報リテラシーを高めていくことを意味する。内容は、入門書的で、ソフトウェアの操作の HOW TOモノではない。
ただ、分析、解析に必要な内容は盛り込まれていると思う。
交絡、誤差(残差)、Plan-Do-See-Checkサイクルなど。
また、ソフトウェアの紹介では、RとExcelの両方を例に出し、
比較している部分も良いと思う。実際には、Rのほうがいろいろ細かい作業ができるのだが、
Excelで出来る部分はExcelでやればよいと考える。個人的に、ちょっとふざけた本だということが、一番よい。
ふざけている点は以下。
・顧客とアナリストのやりとりが陳腐
・挿絵(画像)の使い回し加減がひどい。
・Q&Aがあるが、これもイマイチ納得いかないものもある。
・詳しくしりたきゃ、統計学の本読めとアドバイス。・・・そりゃそうだ!
・3200円は高くねぇ?以上。




