Bluemo's Brain

Search

GPT-3

Last updated Dec 16, 2022 Edit Source

- Transformerのデコーダを使用 - Open AIが作った言語モデル (GPTのv3) - めっちゃ巨大なモデル - Common Crawlというコーパス、書籍、Wikipedia等を使っている - 巨大なコーパスがあると、同じ文が繰り返し出るのを防げる = 文を覚えたりしないで訓練できる - 言語モデルを他の様々なタスクにも応用 (どうやって?) - タスクのタイプ - zero-shot型 (やることだけ自然言語で指定) - few-shot型 (やることの指定に加え、実例も指定) - ニュース記事生成 - 文章補完 - 機械翻訳 (!?) (コーパスに少し(7%)含まれていた他言語の情報だけで、高性能の翻訳ができるように) - 苦手: 合意関係認識(AがBから推論可能か判定)、二つの文を比較する学習はしていないから? - #自然言語処理

Backlinks

大規模言語モデルを使ってEssay執筆

大規模言語モデルを使ってEssay執筆

 やをうまく使って、協力しながら執筆する方法を模索したいもちろんplagiarismにならない範囲で何をしたらplagiarismになるのか分からんが @blu3mo: せっかくなので、今週末締め切りのレポートの執筆にChatGPTがどう使えるかを実験してみたい（もちろん剽窃はしないようにしつつ、と言いたい所だが何をしたら剽窃になるのだろうか..?）やり方の案: ...

1/3/2023
言語モデル

言語モデル

...* P( | hello world) 各単語について、それ以前の文章から考えてその単語がどのくらいありうるかを評価 P(a|b)をどうするかの出現頻度で簡単に計算できる低頻度な現象には弱い 0を返されるとP(a|b)の総乗が0になってしまうによる近似単語以前の全てではなく、単語以前のn単語のみを用いて nが小さいほど、低頻度な物に強くなる nが多いほど長い文脈を考慮できる機械翻訳n=4 (4-gram)までが一般的による推定に突っ込む言語モデルは、等を測る上で単語間の繋がりの情報を保持しているつまり、言語モデルは文章等をにエンコード/デコードする物とも定義できる? によるに突っ込んで () 出力はで0~1に正規化長い文になると、各単語が出力ベクトルに与える影響が小さくなってしまう出力ベクトルのサイズは固定アテンションの重みを計算して、重要な単語を強く反映させるのを無くして、注意機構のみでエンコード/デコードベクトルへのエンコードと、その別言語によるデコードができればが出来る , などはの応用言語モデル様々なタスクに適応できる大規模モデルはメンテナンス等にコストかかり、扱いにくい専用の小さいモデルと比べて、この点がデメリット軽量なモデル(とか)も作られている......

1/3/2023
Github Copilot

Github Copilot

...friendly chat with @github #copilot about #Coffee > https://twitter.com/mhadaily/status/1418444259183796224 これ、GPT-3の仕組みを知らないとすごい不気味に見えそう「自我を持って、本来の仕事から逸脱したことをし出すAI」に見える ...

1/3/2023
Shortly.ai

Shortly.ai

https://shortlyai.com/ 文章を補完してくれるサービス強すぎる使ってるやつ良い点書いている途中で手も思考も止まった時に、これで生成すれば「それが良いか悪いか」という思考が働いて作業が再開する悪いなら直せば手が動くし、良いならそれで良い生成された表現を直接使わなくても、言い回しとか言及内容とかが参考になる...

1/3/2023