ニコニコ動画を対象にした学術研究

ニコニコ動画の有料会員数がそろそろ50万人になるようです。
黒字化に向けてがんばっていただきたいものです。

さて、そんなニコニコ動画ですが、最近では若干ですが学術研究の対象にもなってきています。
コメントをアノテーションとみなしてその量からサビが検出できないか*1とか、ニコ動上での初音ミクの素材の再利用ネットワークの解析をしてみたり*2、非負行列因子分解(NMF:Non-negative Matrix Factorization)をコメントに適用することでコメントから動画の分類をしてみたり*3、等々。
(この辺で調べると他にもあります*4 )
ちなみにニコ動のアイディアはそもそも学術研究から来ているという話もあったりします。*5
あとは、ニコニコ動画データ分析研究会*6なども行われていたりしますね。

かく言う僕自身も10月の下旬に開催されるJAWS2009で、恐れ多くもニコ動を題材に発表してまいります。せっかくなので簡単に手法と結果を下記に書いちゃいます。
詳しいのはそのうち公開するかもしれない論文を読んでいただければと。



「コメントをアノテーションとみなしシーンの検索を行う」
技術的には難しいことをしておらず、基本的に動画をユニットに区切って、ユニット内のコメントをスコアリングして閾値以上のユニットを検索したシーンとするといった具合です。
スコアリングするに当たって、検索したいシーンに関するキーワードには重みを付けてあげます。
また、動画長やコメント数の違いにある程度対応できるようスコアの正規化も行ってあげます。
で、実際にこの方法でどんな感じの精度で検索できるのか実験してみました。
実験は、
1.サッカーのゴールシーン
2.サッカーの動画で複数の被験者が印象に残ると感じたシーン
3.アイマスのやよいが登場するシーン
4.麻生首相が発言しているシーン
をそれぞれ複数の動画について、重みαと閾値δを替えながらシーンの検査精度を測定してみました。
実際に各動画を閲覧し検索したいシーンの時間を書き出しておいて、システムが結果として返したシーンに書き出した時間が含まれていれば正解とします。
検索精度の指標は、情報検索の精度表現でよく用いられる、再現率と適合率の調和平均であるF値を用いています。当然値が高い方がよい結果です。
図1.ゴールシーンの検索精度

図2.サッカーの印象に残るシーンの検索精度

図3.やよいの登場シーンの検索精度

図4.麻生氏の発言シーンの検索精度

ん〜、なんとも微妙な結果ですw
ある程度の精度と言えば精度ですが、良いとは言えないでしょうね(ぇ
でも、シーン検索や動画要約でよく用いられる既存手法である、映像解析などに比べるとマシンパワー、金銭的コスト、汎用性では有用かなと思います。
ただ、検索したいシーンを表すキーワード群を用意してあげないといけない、ジャンルなどによって適切な重みが違うなどのデメリットもあります。
その辺をどうにか解決できればもう少し使えるものになるかもしれないですねぇ。
(キーワード群に関しては論文中ではオントロジーのように集合知を用いることで解決できるとはしてますw

まあ、自分のことを棚に上げて言いますと、ニコ動を題材にした研究はどれも現段階ではある程度の結果で、とても良い結果だよ!というのはない状態です。
ただ、始めにも書きましたが有料会員数も50万人に近づきつつあり、ミクやニコマスなど独特な文化形成に多大なる(色んな意味の)パワーがこれだけつぎ込まれているのは中々珍しいと思います。
これから先、何か発想の転換的な感じでとても役立つニコ動を題材にした学術的研究をしてくれる人が現れるのを期待してます。

*1:青木秀憲, 宮下芳明, ニコニコ動画における映像要約とサビ検出の試み, 第75回音楽情報科学研究会 / 第128回ヒューマンコンピュータインタラクション研究会(2008)

*2:M. Hamasaki, H. Takeda and T. Nishimura, Network Analysis of Massively Collaborative Creation of Multimedia Contents Case Study of Hatsune Miku videos on Nico Nico Douga, in First International Conference on Designing Interactive User Experiences for TV and Video(2008)

*3:澤田敬治, 手塚太郎, 木村文則, 前田亮, 動画共有サイトにおけるコメントを用いた動画分類精度の向上, FIT2009(2009)

*4:http://scholar.google.com/scholar?&q=nicovideo

*5:http://synvie.net/

*6:http://nicovideo.g.hatena.ne.jp/Yoshikawa/20081219/1229678324