uni farm

論文メモ: ネットワーク構造を対象とした特徴量抽出とその応用

論文メモ: “ネットワーク構造を対象とした特徴量抽出とその応用”

メタ情報

  • 論文へのリンク

http://www.orsj.or.jp/archive2/or60-8/or60_8_468.pdf

  • 筆者・所属機関

羽室 行信(関西学院大学経営戦略研究科)

中原 孝信(専修大学商学部)

  • 投稿日付

2015/08

論文内容

概要(一言まとめ)

ネットワーク解析におけるグラフ構造について特徴量の抽出方法と、その応用方法をまとめている

pos(購買履歴)データとtwitterデータを対象として、共起関係より距離関数を定義して、商品間、単語間の関係を表現し、各々グラフ構造について、特徴的な構造を取り出して、評価している

新規性(何が過去の研究に比べて凄い?)

過去がわからないのでスキップ

手法の概要

  • PMIを用いて、リンクを貼る閾値を設定することでグラフ研磨をしている。これを行うことでコミュニティ検出において、クリーク(3つ以上のノードが完全グラフとなる部分グラフ)を減らすなど、特徴的な構造を明確化している

  • NetSimile法にてネットワーク間の類似度を測定する

これらの手法を用いてtwitterデータからはツイートの要約とクラスタリングを。購買履歴からは店舗間の購入商品の特徴、来店頻度の高い優良顧客の判別を行っている

コメント

ネットワーク解析から、共起語のクラスタリング、商品の購入頻度、同時に買われる商品、また教師あり学習の特徴量としても使うなど、

応用範囲とその考察がかかれている。グラフ研磨は定石なやり方なのか気になった

関連情報(あれば)

なし

次に読む論文

未定

自分なりのアウトプット

わからなかった用語とかメモしておきたい用語

  • 類似度グラフ

類似度が一定以上ならリンクを貼る、などとして生成した無向グラフのこと

類似度として、論文中ではPMIを用いている、他にもJaccard係数を用いることもある

  • PMI(pointwise mutual information)

ノードu、vに対して、生起確率p(u)、p(v)、共起確率p(u,v)とすると

PMI(u,v)=log2p(u,v)p(u)p(v)PMI(u,v) = \log_{2}\frac{p(u,v)}{p(u)p(v)}

で表される。大きいほど共起しやすいと言える

  • エゴネットワーク

あるノードから1-hop(リンクを一つたどること)で到達できるノードからなる、部分グラフのこと

気になった英単語・英語表現

日本語なのでなし

フォーマットはからあげさん考案のものを参考にしている

https://karaage.hatenadiary.jp/entry/2018/08/13/000000

2022, Built with Gatsby. This site uses Google Analytics.