Skip to content

Latest commit

 

History

History
120 lines (79 loc) · 6.39 KB

SGDInfluence.rst

File metadata and controls

120 lines (79 loc) · 6.39 KB

XAI/SGD Influence

SGD Influence と呼ばれる手法を用い、画像認識を行うモデルにおいて入力画像が学習結果(精度)へ与える影響をスコアとして算出します。学習に悪影響を及ぼした順に並び替えてデータセットとスコアを表示します。

本プラグインでは、以下の3論文をベースとした近似アルゴリズムを使用しています。

Input Information

input-train

SGD Influence処理を行う対象の画像ファイル一覧を含むデータセットCSVファイルを指定します

こちらのデータセットに含まれる各画像についてスコアが算出されます

input-val

画像ファイル一覧を含むCSVファイルを指定します

SGD Influence処理を行う際には、評価を行う対象であるinput-train以外に内部計算用のデータセットが必要となります

そのために、input-trainに指定したCSVファイルとは異なるデータセットCSVファイルを指定します

output 評価結果を出力するCSVファイルのファイル名を指定します
n_trials 試行回数を指定します。input-train で指定されたデータセットをシャッフルして指定した回数のInfluence計算を繰り返し、その平均値を算出するために用います。
model

SGD Influenceの演算に用いるモデルファイル(*.nnp)を指定します

評価タブで選択中の学習結果を元に計算を行うには、デフォルトのresults.nnp を使用します

batch_size SGD Influenceのモデルが学習する際のbatch_sizeです

Output Information

本プラグインの実行結果は 'output' で指定した名前のCSVファイルとして出力されます。 CSVファイル内の各カラムに関しての情報は以下の通りです(以下のリストに無い名称のカラムは、 '評価' の結果得られる output_result.csvと同様の意味です)。

influence 本プラグインによって計算された、対象のインスタンスのInfuence値です。本CSVファイルの行はこのInfluence値によってソートされています
datasource_index 対象のインスタンスの input-train`のデータセットCSVファイルにおけるインデックスを意味します。再学習の際などに、 `input-train のデータセットCSVファイルと同じ順番に並べ替える際に利用します

XAI/SGD Influence (tabular)

SGD Influence と呼ばれる手法を用い、テーブルデータを用いた分類を行うモデルにおいて、ある分類結果に関する入力データが学習結果へ与える影響をスコアとして算出します。学習に悪影響を及ぼした順に並び替えてデータセットとスコアを表示します。

ご注意 現在、dropoutが含まれるネットワークにおいて、当プラグインが動作しない不具合が確認されています。

Satoshi Hara, Atsushi Nitanda, Takanori Maehara. "Data Cleansing for Models Trained with SGD". Advances in Neural Information Processing Systems 32, pages 4215–4224, 2019.

Input Information

model SGD Influenceの演算に用いるモデルファイル(*.nnp)を指定します 評価タブで選択中の学習結果を元に計算を行うには、デフォルトのresults.nnp を使用します
batch_size SGD Influenceのモデルが学習する際のbatch_sizeです
input-train SGD Influence処理を行う対象のデータを含むデータセットCSVファイルを指定します。 こちらのデータセットに対してスコアが算出されます。
input-val input-trainに指定したCSVファイルとは異なるデータセットCSVファイルを指定します。 SGD Influence処理を行う際には、評価を行う対象であるinput-train以外に 内部計算用のデータセットが必要となります。
output 評価結果を出力するCSVファイルのファイル名を指定します
n_trials 試行回数を指定します。input-train で指定されたデータセットをシャッフルして指定した回数のInfluence計算を繰り返し、その平均値を算出するために用います。

Output Information

本プラグインの実行結果は 'output' で指定した名前のCSVファイルとして出力されます。 CSVファイル内の各カラムに関しての情報は以下の通りです(以下のリストに無い名称のカラムは、 '評価' の結果得られる output_result.csvと同様の意味です)。

index 対象のインスタンスの input-train`のデータセットCSVファイルにおけるインデックスを意味します。再学習の際などに、 `input-train のデータセットCSVファイルと同じ順番に並べ替える際に利用します
influence 本プラグインによって計算された、対象のインスタンスのInfuence値です。本CSVファイルの行はこのInfluence値によってソートされています