ED法を今更理解する

要旨 Winnyの作者、金子勇が提案した(そしてrejectされたらしい)誤差拡散法(Error Diffusion algorithm, ED法)を理解する。 web.archive.org 今更ではなくない? ブログに公開されたのは1999年だから今更ではあるよ。 では解説する。 概要 ED法ではNNにおけ…

ハミルトニアンモンテカルロ法を今更理解する

趣旨 ハミルトニアンモンテカルロ法(HMC)を理解する(執筆当時ではまだ理解できてないけど)。 注意 物理ど素人なので完全には理解できてない。情報の正確性には注意。 理解してないなら「理解する」とか書くなよ うるせーよ では解説する。 HMCとは Metropoli…

ギブスサンプリングを今更理解する

趣旨 MCMCの一つであるギブスサンプリングを理解する。 MCMCって? 前の記事を参考にしてください。 usapyoi.hatenablog.com では解説する。 ギブスサンプリングとは MCMCの一つで、Metropolis-Hastingsアルゴリズムの特殊な例と言える。 問題設定 今、区間…

MCMCを今更理解する

趣旨 MCMC(マルコフ連鎖モンテカルロ)の理解を目的に、基本的なMetropolis-Hastingsアルゴリズムをまとめる。 なぜMCMC? 名前が可愛いから 情報学徒として当然だよね。 では解説する。 MCMCとは サンプリングを行うアルゴリズムの群。MCMCという特定のアルゴ…

変分ベイズを今更理解する

趣旨 変分ベイズを理解する。 なぜ変分ベイズを? この前EMアルゴリズムを解説した。 usapyoi.hatenablog.com じゃあ次は変分ベイズだね。 変分ベイズはEMより圧倒的に数式を追うのが難しいので頑張りましょう。 表記法 : 観測変数(即ち入力) : 潜在変数 モデ…

EMアルゴリズムで今更GMMを解く

趣旨 前回紹介したEMアルゴリズムを用いて超有名なグラフ混合分布(GMM)を解く。煩雑な計算については極力述べず、統計的な観点から重要な点だけおさえる。 usapyoi.hatenablog.com なんで今更? うるさいなぁ理解を深めるため。 では解説する。 表記法 1. 入…

EMアルゴリズムを今更理解する

趣旨 EMアルゴリズムを理解する。 なぜEMアルゴリズム? なんか名前がかっこいいから機械学習を学ぶ人間として当然だから。 他にも解説記事いっぱいあるけど? 表記揺れ、定義の揺れが酷すぎて比較しづらい。例えば後述のEステップについて揺れがある。 では解…

Pythonライブラリ集

地味に役立つPythonライブラリを紹介(随時追加予定)。派手に役立つもの(numpyとか)はいちいち紹介しない。 ydata_profiling docs.profiling.ydata.ai DataFrameの特徴をサクッと可視化するライブラリ。欠損値とか統計量とか散布図とかはこれで表現できるので…

Deep Graph Representation Learning and Optimization for Influence Maximization(ICML 2023)

Author Chen Lingらのチーム Link icml.cc メモ書き 影響力最大化(Influence Maximization)について 影響力最大化とは、以下を満たすを探すこと。 ここで、は影響拡散モデルであり、を感染させた時にどれぐらいその感染が広がるかを示す。要するに、個以下の…

LazyGNN: Large-Scale Graph Neural Networks via Lazy Propagation(ICML 2023)

Author Rui Xueらのチーム Link icml.cc メモ書き 長距離関係(離れた位置にあるノード同士の関係性のこと?)を捉えることによって性能向上が見られる 従来の手法では、GNNを深層化することによってこれに対処しようとしたが、グラフが大きくなるにつれて計算…

Alternately Optimized Graph Neural Networks(ICML 2023)

Author Haoyu Hanらのグループ Link icml.cc メモ書き GNNモデルは以下の二つのアルゴリズムからなる 特徴変換…入力特徴を低次元空間に写像するもの。学習可能なパラメタを持つ 特徴伝搬…グラフ構造を利用して情報を伝搬するもの。the message passing schem…

Leveraging Label Non-Uniformity for Node Classification in Graph Neural Networks(ICML 2023)

Author Feng Jiらのチーム Link icml.cc メモ書き Node分類において、一様分布とのWasserstein距離を用いたnon-uniformityを導入(この概念自体は前の研究で提言されていた -> [2304.03507] Distributional Signals for Node Classification in Graph Neural …

RGE: A Repulsive Graph Rectification for Node Classification via Influence(ICML 2023)

Author Jaeyun Songらのグループ Link icml.cc メモ書き ノード分類問題: の予測性能を低下させる(と、検証データから推測できる)エッジ(opponent edge)をうまく削除する方法 Exhaustive edge Group Elimination(EGE)では、悪影響のあるエッジを順に並べて、…

JSAI2023 4日目感想 : 時系列予測における人工データを用いたデータ拡張

背景 時系列データ予測において訓練データの足りなさが問題で、データを水増しするか転移学習するかしないと予測精度が上がらない。 関連研究 自動生成した人工的な時系列データ(人工データ)を用いてモデルを事前に学習しておく転移学習を行った研究がある(…

JSAI2023 4日目感想 : 抽象的な商品画像を学習したCVAEに基づく商品画像生成モデルの提案

背景 ECサイト上で顧客は各商品に付与された商品情報、特に視覚情報である画像に注目して判断する。なので、顧客のニーズをとらえた商品画像があれば売り上げが上がる。 関連研究 顧客は何らかのキーワードを属性として指定して検索し、得られた商品一覧の商…

JSAI2023 4日目感想 : 自然強化学習における動的な目的水準の調整

背景 エージェントと環境の相互作用により学習を行う強化学習は、状態数の増加に伴い計算コストが増大する問題があった。それに対し自然強化学習は、目的水準を定めることで強化学習よりも簡単な弱教師あり学習を可能にしている。 先行研究 RSは上述の通り目…

JSAI2023 4日目感想 : 製袋企業における購買行動データからの顧客ロイヤルティ推定

背景 ECサイト上で顧客データを使って分析するのが活発化してきたけど、顧客データのみでは限界がある(例えば、競合他社へ乗り換える可能性を検出できない)ので、顧客ロイヤルティ(企業・顧客の関係性の指標)への理解が必要。しかし、ロイヤルティの理解はア…

JSAI2023 3日目感想 : 製袋企業における購買行動データからの顧客ロイヤルティ推定

背景 ECサイト上で顧客データを使って分析するのが活発化してきたけど、顧客データのみでは限界がある(例えば、競合他社へ乗り換える可能性を検出できない)ので、顧客ロイヤルティ(企業・顧客の関係性の指標)への理解が必要。しかし、ロイヤルティの理解はア…

JSAI2023 3日目感想 : 社会的状況に関する情報を含む日本語コーパスの機械学習モデルへの適用性検証

○Muxuan Liu、小林一郎(お茶の水女子大学、産業技術総合研究所) ○宮尾裕介(東京大学、産業技術総合研究所) ○石垣達也、上原由衣、高村大也(産業技術総合研究所) 背景 ビジネスメールの内容から社会的立場や場面などをアノテーションするコーパスを作ったので…

JSAI2023 3日目感想 : 文章の意味的類似指標に関する一検討

○田中大智、重松祐匡、木山真人、尼崎太樹(熊本大学) 背景 自然言語生成システムの評価は人間が作成した参照文とシステムが作成した候補文を比較する形で行われる。しかし、BLEUやROUGEなどの手法は、二つの文を意味的な類似性よりも、単語の一致度に依存し…

JSAI2023 3日目感想 : インターネットテレビのニュース番組に投稿されるコメントの内容分析

○阿閉凛、小川祐樹(立命館大学 情報理工学部) ○高野雅典、森下壮一郎(株式会社サイバーエージェント) ○髙史明(東洋大学 社会学部) 背景 インターネットテレビによるライブ放送は、視聴者同士のチャット機能によるコミュニケーションが特徴だが、コメントによ…

JSAI2023 2日目感想 : グラフ自己符号化器を用いた時系列グラフデータの解析

○石川彰夫、春田秀一郎、黒川茂莉(KDDI総合研究所) 背景 グラフニューラルネットワークが注目されている。現実世界のグラフは時間によってその構造が変化する「動的グラフ」であるが、次の時点でリンクが生成されるか、また既存のリンクの重みが変わるかなど…

JSAI2023 2日目感想 : 波形類似度と合成波の原理に基づく多次元系列データ次元削減法

○蛭田興明、高屋英知(慶應義塾大学 大学院理工学研究科) ○栗原聡(慶應義塾大学 理工学部) 背景 大規模時系列データの解析、価値提供技術は発展途上で、最も大きな問題の一つに、計算コストが挙げられる。なので、次元削減を行うことで重要な情報を残しつつ計…

JSAI2023 2日目感想 : 階層クラスタリングの安定化

○原聡(大阪大学) ○竹内孝(京都大学) ○吉田悠一(国立情報学研究所) 背景 データ間の類似関係を階層構造で表現する階層クラスタリングには「安定性」という問題があって、例えばデータが1点削除されただけでもう階層構造が変わったりする。なのである程度デー…

JSAI2023 2日目感想 : ROCKET特徴量を用いた多変量時系列データ分類における変数重要度の導出

○大場拓慈、長沼茂太、塩澤暁広、山下遼人(株式会社NTTデータ数理システム) 背景 時系列データをROCKETカーネルと呼ばれるもので高次元空間に特徴量を写像、その後リッジ回帰などの分類器を用いて分類するといい感じの結果が得られるが、高次元空間に写像す…

JSAI2023 2日目感想 : Graph Based Entropyと市場ベータを用いた株式市場の異常検知

○中田喜之、吉野貴晶、杉江利章(ニッセイマネジメント株式会社) ○関口海良、大澤幸生(東京大学) 背景 市場ベータは投資家が注目する指標値の一つで、銘柄と市場との関連性を示す。よって、市場ベータの高い銘柄が物色される具合は、そのまま投資家の市場の先…

JSAI2023 2日目感想 : 反復Edge-Popアルゴリズムによるランダムネットワークの刈り込み

聞いた発表の要旨と感想を書きます。 ○岩澤有祐、平川雅人、松尾豊(東京大学) 背景 まず前提知識として宝くじ仮説と強い宝くじ仮説がある。 宝くじ仮説…学習済のニューラルネットワークについて、あるサブネットワークが存在し、そのサブネットワークのみ…

Introduction to Cryptography Chapter 7

Here we define gcd and fast exponentiation as functions: def gcd(x, y): if y == 0: return x return gcd(y, x % y) def power(a, d, n): l = [] cur = d while cur != 0: l.append(cur % 2) cur = cur // 2 r = [] cur = a % n for i in range(len(l)):…

An Attention Free Transformer

概要 Transformerは従来のRNNやCNNと比べて計算量を大幅に減らしたが、まだその計算量は大きいままである。ボトルネックとなっているのは、Attention layerにおける行列積の計算で、テキストサイズの2乗に比例した時間がかかっている。そこで、行列積に近似…

Introduction to Cryptography Chapter 3

Exercise 3.16.1 #include <iostream> using namespace std; int main(){ string input = "VHFUHW"; for(int shift = 0; shift < 26; shift++){ cout << "shift: " << shift << " "; for (char chr : input) cout << char('A' + (chr - 'A' + step) % 26); cout << end</iostream>…