大規模言語モデルSwallow　産総研と東工大が公開

ChatGPTに始まった最近のＡＩ革命は、現在も着々と進行中で、ネット空間から収集した膨大なデータを日々「学習」し、その知的能力を飛躍的に高めています

その能力向上スピードが余りにも速いので、人間の知的能力がＡＩによって完全に凌駕（りょうが）される日（Singularity）も近いと言われています

それが人類にとって天国になるか地獄になるか、まだ予断を許さないようですが、ＡＩの能力向上は24時間365日続いています

特に日本語の自然言語解析に必要な大規模言語モデル（LLM）が新たに開発されたというニュースです

((((;ﾟдﾟ))))

＊　＊　＊　＊　＊　＊　＊

12/19、産業技術総合研究所と東京工業大学の研究チームは、言語モデル「Swallow」を公開した。

「Swallow」は、米Metaが開発したLLM「Llama 2シリーズ」をベースに、日本語能力を改善させた、日本語に強い大規模言語モデル（LLM）

研究チームは、非営利団体「Common Crawl」が収集配布しているアーカイブ（2020～2023年に収集した約634億ページ）から日本語のテキストを独自に抽出・精錬し、約3121億文字（約1.73億ページ）からなる日本語のデータベース（コーパス）を構築した

＊　＊　＊　＊　＊　＊　＊

「Swallow」という名称、たぶん東工大のマーク（→）から来ていると思います

産総研にも東工大出身者が多いですからね

四角い枠が東工大の「工」、中央のツバメ（Swallow）が「大」を表しています

来年、医科歯科大との統合で東京科学大学になると、このマークも変わるのかもしれません

(^_^;)

2bddfe8054252767773f6748ff53ae4c