ChatGPTに始まった最近のAI革命は、現在も着々と進行中で、ネット空間から収集した膨大なデータを日々「学習」し、その知的能力を飛躍的に高めています
その能力向上スピードが余りにも速いので、人間の知的能力がAIによって完全に凌駕(りょうが)される日(Singularity)も近いと言われています
それが人類にとって天国になるか地獄になるか、まだ予断を許さないようですが、AIの能力向上は24時間365日続いています
特に日本語の自然言語解析に必要な大規模言語モデル(LLM)が新たに開発されたというニュースです
((((;゚д゚))))
* * * * * * *
12/19、産業技術総合研究所と東京工業大学の研究チームは、言語モデル「Swallow」を公開した。
「Swallow」は、米Metaが開発したLLM「Llama 2シリーズ」をベースに、日本語能力を改善させた、日本語に強い大規模言語モデル(LLM)
研究チームは、非営利団体「Common Crawl」が収集配布しているアーカイブ(2020~2023年に収集した約634億ページ)から日本語のテキストを独自に抽出・精錬し、約3121億文字(約1.73億ページ)からなる日本語のデータベース(コーパス)を構築した
* * * * * * *
「Swallow」という名称、たぶん東工大のマーク(→)から来ていると思います
産総研にも東工大出身者が多いですからね
四角い枠が東工大の「工」、中央のツバメ(Swallow)が「大」を表しています
来年、医科歯科大との統合で東京科学大学になると、このマークも変わるのかもしれません
(^_^;)