Bluemo's Brain

Search

BERT

Last updated Dec 16, 2022 Edit Source

- Transformerのエンコーダを活用 - GPT-3より遥かに小さいが、合意関係認識はGPT3より得意

Backlinks

イデア

イデア

 はある意味イデア? 人間の認知的にはいわゆる「」のことイデア（概念）そのものを理解できるって生まれるのかなとかが言葉をベクトルにしたり、画像分類器が画像にラベル付けしたりはできるその先に、概念そのものをベクトル化できるものが生まれてくるのかなーと予想それができたら、のと同じ感じになりそう...

1/3/2023
言語モデル

言語モデル

...* P( | hello world) 各単語について、それ以前の文章から考えてその単語がどのくらいありうるかを評価 P(a|b)をどうするかの出現頻度で簡単に計算できる低頻度な現象には弱い 0を返されるとP(a|b)の総乗が0になってしまうによる近似単語以前の全てではなく、単語以前のn単語のみを用いて nが小さいほど、低頻度な物に強くなる nが多いほど長い文脈を考慮できる機械翻訳n=4 (4-gram)までが一般的による推定に突っ込む言語モデルは、等を測る上で単語間の繋がりの情報を保持しているつまり、言語モデルは文章等をにエンコード/デコードする物とも定義できる? によるに突っ込んで () 出力はで0~1に正規化長い文になると、各単語が出力ベクトルに与える影響が小さくなってしまう出力ベクトルのサイズは固定アテンションの重みを計算して、重要な単語を強く反映させるのを無くして、注意機構のみでエンコード/デコードベクトルへのエンコードと、その別言語によるデコードができればが出来る , などはの応用言語モデル様々なタスクに適応できる大規模モデルはメンテナンス等にコストかかり、扱いにくい専用の小さいモデルと比べて、この点がデメリット軽量なモデル(とか)も作られている......

1/3/2023
NLP_Note

NLP_Note

... 紐付け位置、最初の部分だけで良いのかな長すぎる文/短すぎる文をそのまま突っ込んで問題あるかな長すぎる文は、だいたい発言の連続 BERTかけるだけで問題ないかな選び方にバイアス出そう（動画の長さとか）思ったこと映像の中の欲しい部分を自然言語で書くと、字幕読んで持ってきてくれるものが生まれる "XXX"が引用ってことを学べる? (BERTを突っ込んでると無理かな?）ノートに取るべき/取らないべきところも学ぶ? #自然言語処理 #Minerv...

1/3/2023