読者です 読者をやめる 読者になる 読者になる

「Twitterのトレンド」を数時間前に予測、MITのアルゴリズム"が今更気になったのでちょっとメモ

Twitterのトレンド」を数時間前に予測、MITのアルゴリズム "http://wired.jp/2012/12/27/algorithm-predicts-twitter-trends/"
が,何故か今頃気になり始めたのでメモする

手法

Twitter のトレンド入りした事例(=正例)と,トレンド入りしなかった事例(=負例)を集めてきて,
あるトピックのシグナルがどちらのシグナルに似ているか(距離的に近いか)に基づいて,
トピックがトレンド入りするかどうかを検出する

  • これはプレゼン資料の p39-45 を見るとイメージしやすいと思う
  • 正例・負例との類似度の比がある値を超えてれば,検出したとしている
トピック

トピックとは,トレンドに表示されるようなワード(n-グラム)を指している

シグナル

シグナルとは,あるトピックが付与された(n-グラムを含む)
ツイートの単位時間あたりのツイート数で計算する

データ

訓練データ・テストデータ

2012年6月のトレンド入りしたトピック500,トレンド入りしなかったトピック500
これを 50:50 で分ける

感想

はじめの方に latent source とか潜在的モデル怖いと思っていたら,
実際にはそれは観測できないので,それらが表層に現れた事例ベースで,
トレンド入りするかどうかを検出しましょうという話だった

トレンドを利益に変える技術

トレンドを利益に変える技術