感想文: データサイエンスの無駄遣い

データサイエンスの無駄遣い - 篠田 裕之 を読みました。感想文を書きます。

ざっくり内容

孤独に対してデータサイエンスを駆使して立ち向かうというコンセプトの本です。
例えばChapter 1ではLINEの会話のテキストデータから、どういう時間帯に既読スルーされるのか、どういう内容のチャットを送ったら既読スルーされるのかといったことが分析されています。

他にも3Dモデルを用いて近所の同僚と休日にばったり出会うのを避けるにはどうしたらいいかとか、そういったある種しょうもなくておもしろおかしいネタを大真面目に3Dデータやセンシングデータを使ってデータサイエンスしており、めちゃくちゃウケます。

個人的な感想

データサイエンス的な思考が仕事で必要だと感じたので、まずは日常で簡単に小さく試せるネタがないかなと思って本書を買いました。課題の発見、分析、解釈、可視化といったところは色々情報があるのですが、どうせなら日常でも試してみたいです。結果的にニーズに対してドンピシャの本で買ってよかったなと思いました。仕事で役には立たないと思うけれど、親しみを持つために個人で色々試したいと思っているならアイデアのネタを思いつくことができると思います。

この本を読んで、データサイエンスをネタに色々面白いことができるかもしれないとワクワクしたのが収穫でした。

例えば以下のアイデアが思いつきました。

  • 僕は服に無頓着なのを課題に思っているので、外に出ていく時には服装を写真に撮って、その時の外出が楽しかったかどうかを評価して、この服の時は外出が楽しいことが多いみたいな主張が成り立つかどうかを分析する
  • Twitterの自分のテキストデータを元に、いいねを集めた投稿の特徴を分析する
  • Twitterの自分のテキストデータを元に、10個連続するツイートを与えた時の次のツイート予測を行う
  • ブログのテキストデータを元に、タイトルからブログの内容を予測させる
  • Google Photoで友人に共有しているアルバムで、いいねされる写真といいねされない写真を比較して友人の好みを分析する

だいぶ頭が凝り固まっていたので、「データサイエンスをやるにはデータが必要で、そのためには課題をまず先に考えないといけない」みたいなことを考えていましたが、あんまり課題の重要性を評価せずとも手を動かすネタが見つかって面白くても面白くなくても試しにやってみればいいんじゃないかなという気持ちになりました。

特に、データサイエンスを元に現実世界と接続するコードが書けるところに面白みを感じました。純粋なソフトウェアの世界も面白いのですが、そろそろ外との接続を感じられて外界からフィードバックを受けるソフトウェアを書きたいと思っていたので、これを参考に何かやってみようと思います。