Bluemo's Brain

Search

Search IconIcon to open search

日本語と英語の情報量per文字

Last updated Unknown Edit Source

    • 一般的に、英語1語=日本語2文字と言われている

    • 英語は26文字に対して日本語はもっとたくさん文字がある

      • これで英語一単語と日本語一文字の情報量を比較したら、ちょうど英語n語=日本語2n文字になったりするのかなと
      • あと日本語の文字の使用頻度は当然均一ではないし、どこまで含むと英語n語=日本語2n文字と釣り合うのかも気になる
    • 平均英単語文字数

    • 平均情報量per文字

      • 英語 -log(1/26)= 4.7
      • 日本語 -log(1/
    • これMath IAのネタになるかも

      • ただシラバス外なので怖い
    • #実装するかも