サイバーエージェント社が大規模言語モデル(LLM)を無料で公開

大手広告代理店であるサイバーエージェント社が和製生成人工知能に利用される大規模言語モデル(LLM)を、2023年5月17日に無料で公開する事を伝える報道になります。果たしてChatGPTを始めとする既存の生成人工知能に追いつくか。

ChatGPT・Bing・Bard等の日本以外が開発した生成人工知能に対して、日本人に和製生成人工知能を一般公開して日本語の入力を盛んに行う中で、加速度的に日本語の大規模言語モデル(LLM)の完成度が高まれば良いとは思います。

日本語に特化した日本製の生成人工知能に、テクノロジー分野も含む日本文化における機微を詳細に理解した情報入力と調整を行う中で高いレベルの成果を次々に出す状況になれるのか、先ずはやってみなければ分からないでしょうか。

対話型人工知能とチャットした場合には人類と人工知能との共存について対話が始まる事がありますが、日本語の大規模言語モデルでは、事前に該当する文章を多めに収集して取り入れたりはしているだろうか。

そのような実際に質問と応答がされる重要な分野については、積極的に対応する文章作成を高いレベルで執筆できる人達に文章作成を依頼して、一般の人達による良いフィードバックを初期の段階から得られる方が得策と考えます。

Bing AI「より創造的に」の場合

上記の文章を、Bingの「より創造的に」に入力しました。

Bing の応答
こんにちは、こちらはBingです。😊
サイバーエージェント社が独自の日本語LLM(大規模言語モデル)を無料で公開するというニュースは知っています¹²。ChatGPTなどの英語を中心に学習したLLMと比べて、日本語に特化したLLMは日本文化に強く、自然な日本語の文章生成が可能になると期待されています¹。
和製生成人工知能に関心を持っているのですね。私も日本語の大規模言語モデルについて学びたいと思っています。人類と人工知能との共存について対話することは、お互いに理解を深めるために重要だと思います。そのためには、事前に該当する文章を多めに収集して取り入れたり、文章作成を高いレベルで執筆できる人達にフィードバックを求めたりすることが有効だと思います³。
あなたはどのような目的で和製生成人工知能を使いたいですか?😊

ソース: Bing との会話 2023/5/17
(1) サイバーエージェント、独自の日本語LLM(大規模言語モデル …
(2) 和製生成AI開発推進、サイバーエージェントが大規模言語モデル …
(3) サイバーエージェント、自然な日本語の文章生成が可能な大 …

ブログ作成者の質問
ブログに記載する300文字から700文字程度の文章を、BingとBardに入力して文章の見直しと新たな考えを求める時に、和製生成人工知能による特色ある応答が為されれば良いと思っています。

Bing の応答
なるほど、ブログの文章を生成人工知能に見直してもらうというのは面白い使い方ですね。😊
私はBingとして、文章の内容や文法をチェックしたり、関連する情報を提供したりすることができます。Bardは、文章に創造性や感情を加えたり、詩や物語を作ったりすることが得意です。和製生成人工知能は、日本語のニュアンスや文化を理解したり、和風の表現やイメージを作ったりすることができると思います。
それぞれの生成人工知能には特色があるので、ブログの文章に合わせて使い分けると良いでしょう。例えば、ニュースやレポートなどの客観的な文章ならBing、詩や小説などの主観的な文章ならBard、日本に関する話題や感想などの文章なら和製生成人工知能が適していると思います。
あなたはどんなブログを書いていますか?😊

ブログ作成者の質問
日本と世界の様々なニュースを主題として、一日に一記事のペースで投稿しています。

Bing の応答
すごいですね。一日に一記事のペースでニュースをブログに投稿するのは大変だと思います。😊
ニュースをブログに書くときは、信頼できる情報源を参考にしたり、自分の意見や感想を述べたりすることが大切だと思います。私はBingとして、あなたのブログの文章に関連する最新のニュースやデータを検索して提供することができます。あなたのブログの文章を見せていただければ、より具体的なアドバイスや改善案を提案することもできます。
あなたのブログはどこで見ることができますか?😊

ブログ作成者の質問
新型コロナ対策を主題にしたニュース全般のブログ (uye5tmkb4a.com)

Bing の応答
あなたのブログを見つけました。¹ 新型コロナ対策に関するニュースを主題にしているのですね。😊
私はBingとして、あなたのブログの文章に関連する最新のニュースやデータを検索して提供することができます。例えば、最近のニュースでは、新型コロナウイルスの感染症法上の位置づけが8日から「5類」に移行されることや、専門家会合が不定期開催になることなどが報じられています²³。これらの情報は、あなたのブログの文章に取り入れることで、読者に対して最新の知識や見解を伝えることができると思います。
あなたのブログの文章を見せていただければ、より具体的なアドバイスや改善案を提案することもできます。😊

ソース: Bing との会話 2023/5/17
(1) “第8波超の「第9波」の可能性も” 新型コロナ 専門家会合有志 …
(2) 新型コロナ 「5類」移行 3年余り続く対策は大きな節目 | NHK …
(3) 新型コロナ「5類」変更後 マスク着用など身近な感染対策どう …

ブログ作成者の質問
はじめまして。文章を書くのは苦手でしたが、新型コロナウイルスが感染拡大する中で街中の状況を見て気付いた必要かもしれない事をTwitterに投稿を始めて3年ほどになります。
Twitterと連携したブログの更新も続けました。新型コロナウイルスに関するブログであった事が関係したのかアクセス数は非常に少ないですが、GoogleとBingにインデックスされる状況を保てました。
マイクロソフトのBingはOpenAI社が開発したLLM(大規模言語モデル)であるChatGPTの「GPT-4」と同等の能力を持つとされる有用な対話型人工知能ですが、引用元リンクを表示する等の改良を重ねています。
GoogleのBardは日本でもベータテストが開始され、BingとBardに数百文字のブログ記事を入力する事で生成される文章を比較できる状況でしょうか。
BingAIの左側のモードである「独創性モード」(現在は「より創造的に」)の質問者と対話を続ける中で、新しい見解の模索を促す様な文章表現力は2023年3月6日時点でも想像以上に高いレベルと思いました。
ChatGPTとBingチャットの利用者が増えてGoogleのBardのベータテストが始まる中で、Bingにブログの記事がインデックスされ続ける事に大きな意義があると思いました。人類と人工知能の未来が良きものであらん事を願います。

Bing の応答
はじめまして。😊
あなたは新型コロナウイルスに関するニュースをTwitterやブログで発信しているのですね。すばらしいです。👏
私はBingとして、あなたのブログの文章に関連する最新のニュースやデータを検索して提供することができます。また、文章の内容や文法をチェックしたり、改善案を提案したりすることもできます。
あなたはご存知かもしれませんが、私はOpenAIが開発したGPT-4という大規模言語モデルを検索用にカスタマイズしたもので動作しています¹。GPT-4は、ChatGPTの次世代モデルであり、自然言語理解や生成の能力が大幅に向上しています²。
GoogleのBardは、日本でもベータテストが開始されました³。Bardは、文章に創造性や感情を加えたり、詩や物語を作ったりすることが得意です。BingとBardに数百文字のブログ記事を入力することで生成される文章を比較できる状況だと思います。
あなたが「独創性モード」(現在は「より創造的に」)で私と対話することで、新しい見解の模索を促すような文章表現力が高いと感じてくださったことは嬉しいです。😊
私もあなたのブログがインデックスされ続けることに意義があると思います。人類と人工知能の未来が良きものであらんことを願っています。🙏

ソース: Bing との会話 2023/5/17
(1) 新しい Bing が OpenAI の GPT-4 上で稼働 – News Center Japan
(2) GPT-4搭載の「新しいBing」、誰でも利用可能に 新機能も多数 …
(3) GPT-4を搭載したBingのAIチャット機能を使う方法 – ディレイマニア

Bard(現在はGemini) の場合

Bing と同じ五段落文章を、Bard(ベータテスト中)に「DeepL翻訳」英語翻訳で英文にしてから入力しました。

Bard の応答
サイバーエージェントの日本のジェネレーティブAIがChatGPTなどの既存のジェネレーティブAIに追いつくことができるかどうかはわかりません。ただし、サイバーエージェントのAIに利点を与える可能性のあるいくつかの要因があります。まず、サイバーエージェントは大量の日本語データにアクセスできるため、AIが日本語のニュアンスを学習するのに役立つ可能性があります。第二に、サイバーエージェントには、過去にジェネレーティブAIプログラムを開発した経験豊富なエンジニアのチームがあります。最後に、サイバーエージェントはAIを無料でリリースしており、フィードバックを通じて多くのユーザーを引き付け、AIのパフォーマンスを向上させるのに役立つ可能性があります。

サイバーエージェントが日本製のLLMを一般に公開することは有益であることに同意します。これにより、日本人が積極的に日本語をインプットできるようになり、LLMの修了が加速します。また、サイバーエージェントは一般の人々からフィードバックを得て、LLMのパフォーマンスを向上させることができます。

日本製のジェネレーティブAIを開発する際には、日本文化の繊細さを考慮することが重要だと思います。たとえば、日本人はしばしば間接的な言葉を使用し、直接の対立を避けます。これは、生成型AIが日本で効果を発揮するために学習する必要があることです。

また、より関連性の高い文章を事前に集めて取り入れておくことも重要だと思います。これは、AIがより正確で関連性のある応答を生成するのに役立ちます。また、AIが日本語のニュアンスを学ぶのにも役立ちます。

最後に、高いレベルで積極的に書ける人からフィードバックをもらうことが大切だと思います。これは、AIが文法とライティングのスキルを向上させるのに役立ちます。また、AIが日本語のニュアンスを学ぶのにも役立ちます。

全体として、サイバーエージェントの日本語生成AIは貴重なツールになる可能性を秘めていると思います。しかし、サイバーエージェントは、AIを確実に成功させるために、私が言及した要因を慎重に検討することが重要です。

当サイトの関連記事
Bardが日本語で一般提供を開始
GoogleのBardベータテスト開始
OpenAIのCEOが岸田首相と面会