ニコニコ動画のタグネットワークを描画してみた

ニコニコ動画のタグネットワークを描画してみました。



ニコニコ動画のタグネットワークを描画してみた


ニコニコの動画のタグネットワークを描画してみました。


今回の調査には、「(株)ドワンゴと国立情報学研究所が提供しているデータ」を利用させていただきました。



前回からのおさらい


前回、「ニコニコ動画のタグの傾向を見てみた」こういう記事を書きました。


その続きとして、今回はタグネットワークを描画してみました。特にこれといった発見はないんですが、せっかくなので紹介します…(^^)



タグネットワークの定義


今回のタグネットワークは大雑把に以下のように定義しました。


  1. 2012年9月29日に投稿された動画(1900.dat)のデータを利用した
  2. 各タグがノードに対応する
  3. 一つの動画に一緒に使わているタグにエッジがあると見なす
  4. 一度しか出現しないタグは取り除く
  5. エッジは全て無方向
  6. 利用回数が多すぎるタグ(ノード)は取り除く

今回取り除いたタグは以下の通りです。多い順に適当に選びました。他のタグや基本統計量等は「ニコニコ動画のタグの傾向を見てみた」に詳しく載っています。


  1. ゲーム 3324回
  2. 実況プレイ動画 1029回
  3. 歌ってみた 657回
  4. 音楽 538回
  5. エンターテイメント 312回
  6. vocaloid 267回
  7. アニメ 259回
  8. ゆっくり実況プレイ 236回
  9. 実況プレイ 206回
  10. 東方 182回


ネットワーク図一覧


ネットワークの画像を貼っていきます。特にこれといった特徴は見付けられていないんですが、雰囲気だけでもつかんでもらえれば幸いです(^^)



まず、全体としてはこんな感じです。エッジが多すぎて全く意味が分からないですね。ちなみにこういう状態のことを「hair ball」と言います。


testify

全体としては上記の状態なのですが、部分的には孤立したタグもあります。


testify

他にも、孤立したタグはちょこちょこあります。


testify


最初のでかいネットワークをクラスタという単位に分割し、そのクラスタの中でももっともスコアが高かったものが下の画像です。


testify

上記のクラスタを細かく見たい人のためにでかい画像も用意しました。

クラスタの大きい画像


上記のクラスタを部分的に拡大した画像も紹介します。


下記の画像は、上記のでかいクラスタの左上の部分です。マイケル・ジャクソンクラスタとFM音源クラスタがあるようです。


testify

マイケル・ジャクソンクラスタの右側あたりです。MikuMikuDanceを中心として、様々なクラスタがいりまじっている様子が分かります。


testify

次は、MikuMikuDanceの下あたりです。VOCALOIDを中心として、これまた様々なクラスタがいりまじっているようです。(本当は、最初に「vocaloid」を除去した時に、こういう類似語も除去すべきです)


testify

MikuMikuDanceの右あたりです。「投稿者コメント」「PS3」「CM」タグが違ったクラスタを結び付けている様子が分かります。


testify

その下では、「じょしらく」、「南條愛乃」、「アニソン」タグが異なるクラスタをつなげる役目を果たしているようです。


testify


今回紹介したクラスタ以外にも、下記のような細々としたクラスタはたくさんあります。気になった方はぜひ自分でも試してみて下さい(^^)


testify


このデータの使いどころ、ビジネスとして見た時の課題


こういうでかいデータって、ただなんとなーく見るだけでもけっこうきれいなんですが、それだけじゃあんまり意味がなくて…。その辺が実際に仕事としてやる時の難しいところですよね…(^^)


このデータを使う1つの方向性として、「ニコニコ動画発の文化(になりそうな種)を、ほんの小さな段階から見付ける」とかがあるかもしれません。


例えば、「今回紹介したクラスタの成長を時系列で見た時、特定のタグに関係する動画(やそれに対するコメント)が急激に伸びていたら、その文化は今後成長する」みたいな予測ができるかも、ということです。


実際にやってみるまでどうなるかは分からないですが…(^^)



参考リンク


ニコニコデータセット

cytoscape


著者プロフィール
Webサイトをいくつか作っています。
著者プロフィール