論文メモ: “ネットワーク構造を対象とした特徴量抽出とその応用”
メタ情報
- 論文へのリンク
http://www.orsj.or.jp/archive2/or60-8/or60_8_468.pdf
- 筆者・所属機関 羽室 行信(関西学院大学経営戦略研究科)
中原 孝信(専修大学商学部)
- 投稿日付
2015/08
論文内容
概要(一言まとめ)
ネットワーク解析におけるグラフ構造について特徴量の抽出方法と、その応用方法をまとめている
pos(購買履歴)データとtwitterデータを対象として、共起関係より距離関数を定義して、商品間、単語間の関係を表現し、各々グラフ構造について、特徴的な構造を取り出して、評価している
新規性(何が過去の研究に比べて凄い?)
過去がわからないのでスキップ
手法の概要
-
PMIを用いて、リンクを貼る閾値を設定することでグラフ研磨をしている。これを行うことでコミュニティ検出において、クリーク(3つ以上のノードが完全グラフとなる部分グラフ)を減らすなど、特徴的な構造を明確化している
-
NetSimile法にてネットワーク間の類似度を測定する
これらの手法を用いてtwitterデータからはツイートの要約とクラスタリングを。購買履歴からは店舗間の購入商品の特徴、来店頻度の高い優良顧客の判別を行っている
コメント
ネットワーク解析から、共起語のクラスタリング、商品の購入頻度、同時に買われる商品、また教師あり学習の特徴量としても使うなど、
応用範囲とその考察がかかれている。グラフ研磨は定石なやり方なのか気になった
関連情報(あれば)
なし
次に読む論文
未定
自分なりのアウトプット
わからなかった用語とかメモしておきたい用語
- 類似度グラフ
類似度が一定以上ならリンクを貼る、などとして生成した無向グラフのこと
類似度として、論文中ではPMIを用いている、他にもJaccard係数を用いることもある
- PMI(pointwise mutual information)
ノードu、vに対して、生起確率p(u)、p(v)、共起確率p(u,v)とすると
で表される。大きいほど共起しやすいと言える
- エゴネットワーク あるノードから1-hop(リンクを一つたどること)で到達できるノードからなる、部分グラフのこと
気になった英単語・英語表現
日本語なのでなし
フォーマットはからあげさん考案のものを参考にしている