News

2023.06.01

知財ニュース

サイバーエージェント、最大68億パラメータの日本語大規模言語モデルを一般公開─国内最大規模、商用利用も可能

28817 ext 03 0

株式会社サイバーエージェントは2023年5月17日、独自開発の日本語大規模言語モデル(LLM)を一般公開したことを発表した。

今回公開された日本語LLMは、同社が開発中の一部モデルで、日本国内の現行の公開モデルでは最大規模(※2023年5月17日時点)。WikipediaとCommon Crawlを使用したオープンな日本語データで学習した、最大68億パラメーターの大規模言語モデルがCC BY-SA 4.0ライセンスで提供されている。

ChatGPT」をはじめとする生成AIやLLMは、近年急速な進化を遂げており、世界中のあらゆる業界・ビジネスにおいて活用が進んでいる。一方、既存のLLMのほとんどは英語を中心に学習されており、日本語や日本文化に強いLLMは少ない現状だ。

そこで同社は、本LLMを開発。5月11日には、独自の日本語LLMの開発を発表し、130億パラメーターまでの開発を完了、「極予測AI」をはじめとする同社の広告サービスで活用を開始していると発表していた。

なお、本LLMはAI・機械学習に関する学習済みモデルなどの共有サービス「Hugging Face Hub」で公開され、商用利用も可能とのこと。同社では、本モデルをベースにチューニングすることで対話型AIなどの開発も可能としており、多くのユーザーが日本語の自然言語処理に関する最先端の研究開発に取り組めると期待を寄せている。

プレスリリースはこちら(1)(2)

「Hugging Face Hub」内の公開サイト

お問い合わせはこちら

Top Image : © 株式会社 サイバーエージェント

広告