Attention機構
とは
データのどこに注目するかを推論
入力: contextと、注目度を評価したいデータ群
- それぞれの非線形関数に(context + データの一つ)を入力して、重要度が出力される様に訓練する
出力: それぞれのデータの相対的重要さ
これを、CNNとかLSTMとかと組み合わせる方法が今まで使われていた
- Attention is all you needは、組み合わせる必要すらねぇと言っている?
Search
とは
データのどこに注目するかを推論
入力: contextと、注目度を評価したいデータ群
出力: それぞれのデータの相対的重要さ
これを、CNNとかLSTMとかと組み合わせる方法が今まで使われていた