大規模言語モデルSwallow 産総研と東工大が公開

  • このエントリーをはてなブックマークに追加

l_tm1636144_12202_1_w490

ai_pet_family

 

ChatGPTに始まった最近のAI革命は、現在も着々と進行中で、ネット空間から収集した膨大なデータを日々「学習」し、その知的能力を飛躍的に高めています

その能力向上スピードが余りにも速いので、人間の知的能力がAIによって完全に凌駕(りょうが)される日(Singularity)も近いと言われています

それが人類にとって天国になるか地獄になるか、まだ予断を許さないようですが、AIの能力向上は24時間365日続いています

特に日本語の自然言語解析に必要な大規模言語モデル(LLM)が新たに開発されたというニュースです

((((;゚д゚))))

 

* * * * * * *

 

bird_swallow_9894

 

12/19、産業技術総合研究所と東京工業大学の研究チームは、言語モデル「Swallow」を公開した。

「Swallow」は、米Metaが開発したLLM「Llama 2シリーズ」をベースに、日本語能力を改善させた、日本語に強い大規模言語モデル(LLM)

研究チームは、非営利団体「Common Crawl」が収集配布しているアーカイブ(2020~2023年に収集した約634億ページ)から日本語のテキストを独自に抽出・精錬し、約3121億文字(約1.73億ページ)からなる日本語のデータベース(コーパス)を構築した

詳細はここをクリック

 

* * * * * * *

 

35262439

「Swallow」という名称、たぶん東工大のマーク(→)から来ていると思います

産総研にも東工大出身者が多いですからね

四角い枠が東工大の「工」、中央のツバメ(Swallow)が「大」を表しています

来年、医科歯科大との統合で東京科学大学になると、このマークも変わるのかもしれません

(^_^;)

 

2bddfe8054252767773f6748ff53ae4c

 

  • このエントリーをはてなブックマークに追加

SNSでもご購読できます。