チャットGPTの出現で注目度が高まる「LLM(大規模言語モデル)」。国内スタートアップの間では、研究開発に取り組んだり、事業化に踏み切ったりする事例が生まれている。
LLMとは、膨大なテキストデータを学習させた自然言語処理モデルのことだ。自然言語とは人間が書いたり話したりする言葉を指す。急速に普及するOpenAI社のチャットGPTもLLMの一つで、文章を読み込んだり生み出したりする。
STARTUP DBでは事業内容や対外発表をもとに、LLMを事業に取り込むスタートアップを抜き出した。現状では研究開発段階にとどまる企業も多いが、その一方で独自色あるサービスを世に放つ動きも出てきている。LLM関連スタートアップのうち3割近くが2023年設立で、起業や事業化のうねりが今後も広まっていくかが焦点となる。
LLMなど生成系AIの基礎が分かる記事はこちらから
調査ではまず、STARTUP DBに収録されているスタートアップおよそ21,000社を対象に、事業内容やプレスリリースにLLMの関連用語が含まれる企業を機械的に抽出した。
LLMと直接関係のない企業も多数含まれていたため、目視によるスクリーニングを実施。「LLMを活用したプロダクトを展開している」か「LLMに関する研究開発を実施している」のいずれかに当てはまると判断できたケースを「LLM関連スタートアップ」と定義した。
チャットGPTはAPI(データ連携の仕組み)が公開されていて、チャットボットや文章作成などに活用する企業が多く出現しているが、既存サービスにAPI連携を実施したのみと判断されるケースは除外した。チャットGPTなど生成系AIサービスの導入コンサルティングを手がける企業群も含めないこととした。
また、「LLM関連スタートアップ」の定義づけにあたっては、企業の公式サイトやプレスリリースなどの公開情報のみを参考とした。そのため、発表されていない実際の開発状況やサービス内容と異なる可能性がある。
LLM関連スタートアップは2023年8月末時点で54社。このうちLLMを活用したサービスの将来的な実装を目指す「研究開発段階」は合計24社だった。
例えば、AIを活用して契約書の審査などを行う「LegalForce」を提供するLegalOn Technologiesは、LLMなどの活用に向け2023年度に5億円を投資する。経費精算システムを展開するLayerXは「組織内の知識活用や効率化に関する事業化」のためにLLMの研究チームを運営する。
そのほか、チャットボットを活用して接客する「チャットコマース」のZEALSは、人工知能研究で知られる東京大学の松尾豊・教授が技術顧問を務める松尾研究所と共同で実証実験ソリューションを提供する。
こうした企業に共通するのは、研究開発投資に踏み切るまでに多額の資金調達を実施している点だ。STARTUP DBの集計によるとLegalOn Technologiesは198億7,000万円を、LayerXは111億6,200万円をこれまでに調達している。ショーケース、Finatextホールディングス、AnyMind Groupなど上場企業も目立つ。DMM.comは20億円を投資してLLMを含む生成系AI関連サービスを開発するAlgomaticを立ち上げている。
一方で、調達総額1億円未満で研究開発に挑むケースもある。OpenFashion(旧・オムニス)は2023年4月、ファッション産業に特化したLLMの研究に着手すると発表。「オープンソースを活用した独自LLM」も視野に入れているとした。同社の資金調達総額は8,900万円だ。
生成系AIの研究者・松森匠哉氏が2022年に創業したCarnot(カルノー)も、プレシードラウンドで調達した8,500万円を元手にLLMの基礎研究やサービス開発に取り組む。
母数が24社と限定的なため断定こそ難しいものの、LLMの「研究開発型」は2つに大別されると見て良さそうだ。
1つは既存事業で成長し大型調達やIPOなどを実施した企業が、豊富な資金力を背景にLLMの研究開発に取り組むパターン。こちらは従来サービスの性能や付加価値向上のため、といった色彩が強い。
もう1つはそもそもLLMを活用した事業のため設立されたスタートアップが、比較的早いラウンドで調達した資金を活用して研究開発を始めるケースだ。こちらはCarnotのように「創業者がAIの専門家」という事例が多そうだ。
独自モデルを開発・公表したり、プロダクトとして打ち出したりしているケースも同じく24社あった。
AI技術の開発・社会実装を手がけるオルツは2023年2月、日本発の大規模言語処理モデル「LHTM-2」を開発したと発表。機械翻訳や自動要約、テキスト生成などに活用できるほか、「個人の思考を再現する形で対話」(公式サイト)する実験にも成功したとした。独自LLMの開発にはサイバーエージェントやrinnaも取り組んでいて、このうちrinnaは2023年7月に日英バイリンガルのモデルを公表した。
AI開発のPKSHA(パークシャ)Technologyは2023年3月に「PKSHA LLMS」を発表。AIがもっともらしい嘘をついてしまう「ハルシネーション」を抑制するなどしながらLLMを社会実装できるといい、既に複数の活用事例が発表されている。
Spiral.AIは2023年9月、タレント・ファッションモデルとして活動する真島なおみさんと擬似的な会話ができるサービスをリリースした。チャットGPTはプロンプト(指示入力)によって一定程度、口調や役割を指定することができる。一方で同社は「真面目な回答を行うよう強化学習されており、親しみを感じづらい側面がある」とも指摘していて、キャラクターなどをカスタマイズできる事業にも着手していた。
絶対数こそ多くないものの、LLM領域で事業化や研究開発のうねりが起き始めている。
今回定義した「LLM関連スタートアップ」54社のうち、29.6%にあたる16社が2023年設立だ。Spiral.AIのほか「医学論文の検索に特化したLLM」(公式サイト)などを開発するGenerativeX、令和AI、X‐Regulationなどが当てはまる。
Algomaticのように大企業の資本力を背景に設立された事例のほか、AI研究者による起業、さらに一次産業とテクノロジーを掛け合わせるとしたきゅうりトマトなすびのように大学発スタートアップもある(東大発)。多様な顔ぶれによる研究開発や社会実装が進んでいくことが期待される。
LLMには投資マネーも流れ込んでいる。「LLM関連スタートアップ」のうち14社が2023年に資金調達を実施していて、総額はおよそ121億300万円だった。14社の調達発表を確認したところ、少なくとも11社が▽そもそもLLM関連事業のために設立された企業か、▽調達目的にLLMの事業化もしくは調査研究が含まれる、のいずれかに該当した。
この領域に流れ込むリスクマネーが増えているかどうかは判別しづらい。上述の通り「LLM関連スタートアップ」には、もともと別領域の事業を展開していて、成長後に研究開発投資に乗り出した企業も含まれている。過去の調達にはLLMとは関係のない事例も多分に含まれ、比較に用いるのは適切ではない。
今後は、LLM領域に関連する資金調達を絞り込み、増減を観測していくことが必要になる。次のラウンドの資金調達を実施できるかどうかもポイントだろう。また、設立から日の浅い企業も多く先のことになると思われるが、イグジット事例がどの程度生まれるかも注視したい。
(執筆・編集=高橋史弥 データ抽出=石渡戸紘)