スマートフォンの次なる世界一のモノが生まれる

アフィリエイトASPのマネートラック

始まったAI戦争、ChatGPTやLLM、GPU、HMD、メタバースは今後どうなる?

今、話題のChatGPTを簡単に説明するとChatは「チャットする」を意味する「チャット」で、GPTはOpenAIという会社が作ったLLM(Large Language Models)という技術である。LLMは技術の種類が多い。即ち、OpenAI社が作ったLLM技術がGPTということだ。GPTはバージョンがアップグレードされてきて、バージョン1、バージョン2、バージョン3.5のようになった。
ChatGPTはOpenAI社が作ったLLM技術で作られた対話型サービスと理解すればよい。
例えば、OpenAI社がGPT-3というエンジンを使って作ったイメージ生成するGenerative AIが「DALL-E」である。ネーミングが違うもう一つのサービスである。
だから、OpenAI社のサービスとして理解すればよい。
ChatGPTのGPTがものすごい人気で世に知られたため、OpenAI社はGPTを特許、商標登録してしまって、GPTというのはOpenAI社だけが使えることになった。
ChatGPTのすごいところは、サービスを開始して1年も経たない内にユーザーが5億名に上っていることで、近来ではこのようなことがなかったからである。
ChatGPTはこのような偉業を達成して、新しいパラダイム、カテゴリーを作った。
以前からAIの技術はあった。Googleが作った「AlphaGo(アルファ碁)」も話題にはなったが誰も使ってないというか使えるサービスではなかった。
ChatGPTは日本でもOpenai.comへのアクセス数を見ると、日本からのアクセス数は2023年4月中旬に746万/日に達し、トラフィックシェアは、米国、インドに次いで3番目に多かった。これはサム・アルトマンCEOが作り出した奇跡にちかいことだと言える。
ChatGPTはいきなり現れたものではなく、2017年からGPT-1から着実に努力して5年の年月を経て2022年11月にGPT-3.5バージョンでリリースされた。「DALL-E」は注目を集めなかったが、ChatGPTは対話型で質問すると答えが返ってくるから全世界的に人気が出たと思う。

ChatGPTを可能にしたGPT-4というLLMだが、GPT-4より優れているLLMはまだないに等しい。ただ、GoogleでBardというChatGPTと類似したサービスをロンチングした。
このサービスも思ったより優れてGPT-3.5ぐらいのレベルではないかと評価されている。それからGoogleは全世界的に一番多いデータをクローリング(crawling)する会社で一番多いユーザー接点を持っている会社であるから、これからはChatGPTを超える新しい可能性が見え始めているのが事実である。
整理するとOpenAIのようにLLMを作っている企業はいくつもある。スタートアップの中に「Entropy Inc. (https://www.entropyinc.com/)」と「Cohere (https://cohere.com/)」などもLLMを作っている。他にもChatGPTのようなサービスではないが、「Stability AI (https://ja.stability.ai/)」のような会社は「Stable Diffusion」というサービスを開発し、写真を作ってくれるLLMを作っている。
だが、対話型サービスで答えがうまいのはOpenAIのChatGPTがトップで優れている。ChatGPTを追っているのがGoogleのBardというサービスである。
Bardは2024年2月にGemini(https://gemini.google.com/app)というサービスになってChatGPTを超えるサービスを展開しようとしている。 同じGPT のLLMエンジンでMicrosoftがNewBingというサービスを展開している。この3つの企業がChatGPTと同じようなサービスを展開している。

今のBigTech企業の大きな限界は「ハルシネーション(Hallucination)」と呼ばれているもので、チャットAIなどで、もっともらしいウソ(=事実とは異なる内容や、文脈と無関係な内容)の出力が生成されることを指してAIから返答を受け取った人間が「本当かどうか」の判断に困るという問題があることである。
ChatGPTのようなサービスのためにはLLMの技術が必要で、LLMというのはWeb上に公開されている数多くの人間の言語データをクローリング(crawling)して、収集して作られるものである。
ChatGPT3.5は2021年までWebに公開されているデータをクローリング(crawling)して作ったから2022年と2023年のデータがないから最新情報がない。また特定の分野のバーティカル(Vertical)領域の詳細な情報も持ってないから、「ハルシネーション(Hallucination)」問題になってしまう。
これを克服するために2つの方法を用いている。
1つは、ちゃんと分類された(クラシファイ:Classify)されたデータを追加していく方法「データグラウンディング(Data Grounding)」というのを実施する方法である。データグラウンディングで専門情報がない分野のChatGPTを補強する。
このようなことを主にやっている企業は旅行、法律、金融サイトなどの業界がサービスをしていて持っている多くのデータを、ChatGPTをAPIで呼び出してからデータグラウンディングをして、普通のChatGPTにはない情報をサービスするようにしている。 もう1つは、OpenAIのChatGPTがプラグイン(Plugins)というサービスをロンチングした。プラグイン(Plugins)は主なプログラムに機能を追加して使用する付加プログラムやモジュールのことで、ChatGPT中でWeb上のサービスを呼び出してからプラグイン(Plugins)を通じて答えをする方法である。ChatGPTにはない旅行、法律、金融、医学などの情報がWeb上にある情報を持っている企業がChatGPTプラグインを使ってChatGPT上で情報を提供できる方法である。

「BigTech」の競争は益々激しくなっていくが、全ての企業はWeak point(弱点)を持っている。競争のスタートを切ったのはOpenAIである。OpenAIは、スタートアップで持っているものが少なかったから新しいものを掌握するために攻撃的、挑戦的に進めた。これに今はMicrosoftが一緒になって連合して進めている。Googleと韓国のSamsungが連語したのと似たようなものだ。ただ、GoogleとSamsungは持っているものがあるが、Microsoftは「Microsoft Azure(マイクロソフト アジュール)」というクラウドコンピューティングプラットフォームとハードウェアは持っているが、インターネットサービスは持っているものがない。msn.comサービス、Hotmail、msn Messenger、Bing.comという検索サービスも失敗し、インターネットサービスではOpenAIのようなスタートアップに近いと言っても過言ではない。だからMicrosoftとOpenAIが連合している。これにGoogleが危機意識を持って追っかけている。それから「メタ(Meta)」と呼ばれているFaceBookはこれらとは違うメタバースのLLMを積極的に推進している。
本格的にAGI(Artificial General Intelligence:汎用人工知能)の時代、即ち生成型AIの時代になると今までのようなBigTech企業以外に様々なスタートアップの中からBigTech企業に匹敵する企業が育つかも知れない。
10年前、20年前のモバイルマーケットにはApp StoreにAppが少なかった。だが、2011年からは優れたAppがマーケット溢れるぐらい出てきた。Lineのような会社が大きなレガシー企業を買収したり、SoftBankから投資を受けたりしたように今のAGIマーケットにもそのような可能性がある。OpenAIがマーケットを切り開いて、ChatGPTというサービスで底辺のユーザーを確保した。AIの特徴はデータが多ければ多いほど成長(進化)が早い。だが、Web上のデータをクローリング(crawling)する機械的データもあるが、ユーザーが使いながら生じるデータもある。このような側面からすると全世界に何億のユーザーを持っているChatGPTは今もユーザーが使いながらAIに教えているのと同じである。これは汎用AIを作れるリソースをOpenAIは確保していて進化しようとしている。 MicrosoftのBingという検索エンジンとEdgeというブラウザーは、Google検索とChromeに対して使用性やユーザー占有率、マーケット占有率では話にならないぐらい弱い。だから、ChatGPTを持ってきてNewBingとEdgeブラウザーの性能を改善してユーザーを確保する努力を攻撃的に行うと予想される。

LLMサービスを利用しようとすると「GPU(Graphic Processing Unit)」というチップセットが必要だが、このチップセットはNVIDIAが作っている。チップセットを作るためには費用がかなりかかるため、NVIDIAの株価が今上昇している理由の一つである。LLM時代になってから全世界のLLM企業がNVIDIAにGPUを発注しているからである。
だが、Googleは4世代TPUというGPUを自社開発して持っている。そういうことでGoogleは全世界に誰よりもデータをたくさん持っているし、ユーザーもチャンネルも多いし、インフラ即ちチップセットも独自のものを持っているからLLMサービスができる一番の会社である。Googleは自社が持っている資源とサービスを元にLLMマーケットに革新を起こせる企業でもある。だが、AGIサービスではChatGPTよりまだユーザーが少ないから後発かも知れない。だが、Googleがその気になればどこよりも強いのは間違いない。
全体AGIマーケットでは、MicrosoftとOpenAI連合とGoogleの2つが先頭企業になると思われる。それ以外ではMetaと会社がオープンソースLLMを提供しながらマーケットを作っているEcosystemの中心になると思われる。MetaはQuestPro、Quest 3のようなデバイスを使ったメタバースに強い。だからMetaは自社のメタバースを拡大するための独自のGenerative AIをメタバースで使うと思う。
整理するとMetaはAGIをメタバースという空間の中で他の企業を競り合って勝ち取るのではないかと予想する。

AGI(Artificial General Intelligence)とChatGPTは同じものではなく、ChatGPTはGenerative AIサービスの一つでこのようなGenerative AIで作られるマーケットをAGIという。

ユーザーがChatGPTに教えることを「RLHF」という強化学習のひとつである。ユーザーがChatGPT使う時のプロムプット(Prompt)、質問をして回答をみてからやめるユーザーもいれば回答に疑問を持って何回も回答を要求するユーザーもいる。あるユーザーは使っていてよかったら「いいね」を押したりもする。ユーザーのPromptや回答の満足度、再質問内容などこれらまた学習させることでLLMを強化させていくことである。

NVIDIAの株価や時価総額が今上昇している理由にはAIにものすごい関連性がある。LLMを学習させるためには学習に必要なDataもものすごい量が必要だがLLMを作るためにはGPUというチップセットが必要である。このチップセットを作っているのがNVIDIAで全世界のGPUを殆ど独占的に作っている。NVIDIAはブロックチェーン(Blockchain)を運営してトークン(Token)を作るときにGPUが必要である。この時にもNVIDIAは設けていた。またメタバースが人気のあった2、3年前にもメタバースを実現するにはかなりの量のグラフィックチップセットが必要だからこの時にも設けていて、今はGenerative AIでまた注目されている。この3回の機会でNVIDIAは10年で10倍に近い大きな成長を成し遂げているし、今も成長している。NVIDIAの成長は偶然の産物ではなく、リーダーシップによって計画されたものだと言える。半導体チップセットとグラフィックチップセットを作っていた部品会社にすぎなかったこの企業がAMDとIntelを超えてこのように成長してきたのはマーケットの変化に対して明確に理解をし、それに合わせて企業を変えてきたからである。NVIDIAはGPUを作ってそのまま売っていたわけではない。GPUをクラウドベースで提供するビジネス、最近ではLLMをハードウェアだけ供給するだけではなく、LLMをオープンソースにして供給するクラウドビジネスもやっている。このような時代を先取りするビジネスモデルでマーケットを牽引してきた。未来に対する可能性と技術キーワードを理解し、それに合わせて適時に投資をしてきたと言える。点と線を繋いで面を作っているようにメタバースとAGIなどが繋がった時には新しい世界が作られると思う。このような新しい世界のBackbone Network即ちバックエンドインフラを提供しているのがNVIDIAの役割だと認識して他のビジネスには欲を出さずに未来のメタバース時代、AGI時代が完成されるためにはバックエンドインフラが必要ということにNVIDIAはビジネスチャンスを作っていると言える。

ChatGPTはスタートに過ぎない、終わりではない。ChatGPTを可能にした技術は2つである。カンバセーション(Conversation)のための対話型インターフェースでLLM、GPTを使いやすくした技術である。だからユーザーが知りたいことに対してよく理解して回答を出してくれる。これがWebという領域に留まっている時はそれほどの革新の破壊力を持ってない。検索の代わりの役割にすぎないかも知れないが、これが万が一に次世代のメタバースというフラットフォームに入った時はその革新の破壊力は違うと思われる。
メタバースの定義は人によって異なるが、私が思っているメタバースはHMD((Head Mounted Display)のような新しいハードウェアを通じて出会える世界である。コンピューターで出会えた世界がWeb、スマートフォンで出会えた世界がモバイルのようにHMDのような新しいハードウェア、頭に被るARやVRやXRやMRなどのデバイスで出会える世界がメタバースだと思う。
実際HMDを被って世界を見てみるととても広く、上も下も左右もある3Dの世界が広がっている。この広いスペースを埋めるためのものが現実のように数多くある。メタバースは現実の世界のように家、出勤手段、会社などの数多くの場面とスペースが存在して複雑になっていると言える。複雑なのは使い方が難しい。コンピューターやスマートフォンはキーボード、マウス、指を使って利用できるが、メタバースは両手で持っているコントローラーを使って利用する。この両手のコントローラーを使いこなすのはかなり複雑である。
例えば、メタバースを使えるMetaのQuestというデバイスを使ってMS officeを使おうとするとコンピューターやスマートフォンでAppを起動して使うのとわけが違うほど使い方が複雑になるはずだ。だが、ChatGPTが映画アイアンマン(Iron Man)で登場するジャービス(J.A.R.V.I.S)のようにChatGPTに命令するだけでAppを実行したり、スペースのテレフォートもできたり、ちょっとの言い間違いも正しく修正して理解したりして何でもやってくれることになったらどうなるだろう。このような世界がChatGPTとメタバースが一緒になった時に実現可能な世界になるかもしれない。メタバースのスペースに入った瞬間からジャービスのようなChatGPTが行きたい場所を案内したり、必要情報を案内してくれたり、必要なAppを実行するときも手伝ってくれたり、検索も画面の大きさ調整などもすべてを、ChatGPTを通じて実現できるのだ。

1世代AIアシスタントのAmazonのAlexa、GoogleのGoogle Assistant、Line(正確には韓国Naver)のClovaのようなものがスマートスピーカーの形で私たちの生活をサポートした。だが、質問を理解できてなかったり、理解したとしても回答がなかったり、誤作動たりなど問題が多かった。ChatGPTは生成型AIだから対話が上手で間違ったものも本当のように嘘を言うほど賢い。これがメタバースの世界で私の代わりに聞いたり、情報を収取したりすると使っている本人よりも精巧に世界を認識、理解して必要とする情報とサービスを提供することになる将来の新しい世界になるかもしれない。
メタバースの定義は人によって異なると記した。FortniteやRobloxのようなゲームをメタバースだという人もいれば、Zepetoや10年前のSecondLifeをメタバースだという人もいる。でも私が思っているメタバースは第3のサービスで第3のITフラットフォームである。Webとモバイルは新しいデバイスからスタートした。このようにメタバースはHMDというデバイスを使って、Webとモバイルのような平面ではない立体的なスペース、3Dスペースがあってそのスペースを存分に使えるのがメタバースの定義である。

既存のインターネット精神は、共有、公開、開放であった。すべての情報は共有、公開、開放されないといけないということだ。インターネット世界は平等でないといけない。だから、多くの人たちがただで誰もがインターネットに繋がって必要な情報を検索して調べられる。
これを理想して作られたのがインターネット世界である。このようなインターネット世界は20年以上も我々の日常と社会、産業の多くを変えてきた。便利に使えるようになり、GoogleやMicrosoftのようなBigTech企業も作り出した。悪い点もある。フラットフォーム企業の独占による疲弊も生じている。それらの企業は我々のデータをただで使い誤用、悪用したりもする。FaceBookは我々の情報を用いて、我々の許可なく政治動向を分析して広告販売に使っている、Uber やUber Eatsはデリバリーマーケットのフラットフォームを使って手数料をユーザーの同意なく勝手に上げられる。だからWeb 3(Web 3.0)が登場した。
Web 3とはセマンティックウェブ、人工知能、分散型技術(例えばブロックチェーンやデータプライバシー技術)などの進歩を統合する次世代のインターネットの形である。
Web 3の目的は、ユーザーが情報をより効果的に探し、共有し、統合することで、インターネットをより自由で有用で安全な場所にすることである。例えば、セマンティックウェブはウェブページの意味を理解する能力を機械に与え、ユーザーが必要な情報をより簡単に見つけられるようにする。また、ブロックチェーン技術は、セキュリティを高め、ユーザーが自分のデータを管理する能力を向上させる。
Web 3の精神は公正と分配である。
ESG(「Environment(環境)」「Social(社会)」「Governance(ガバナンス)」)経営のように社会のために公正ではないといけない。インターネットは利害関係者と最小限の合意、論議をしてから許諾、承認を受けてから政策を変更する。手数料などを勝手に上げないで公正性を保つようにする。それから得た収益の全てを分配する。You Tubeは収益を得たのになぜ1%しかYou Tuberにその収益をあげないのか?BigTech企業が収益を独占する不平等が生じている。

インターネットの共有と開放は、「http」というプロトコルでインターネットが互いに繋がって共有と開放の実現を可能にしたようにWeb 3の公正と分配は実現を可能にするためには技術が必要である。それは中央機関や管理者に依存せずに動作する分散型のブロックチェーン技術、サーバーやクラウドのような従来の中央集権的なシステムに比べて、より透明性や信頼性を持ち、改ざんが困難である脱中央集権的技術である。代表的なものがビットコインやイーサリアムなどの仮想通貨プラットフォームが挙げられる。
ブロックチェーンは脱中央集権的技術で作られているからフラットフォーム独占事業者や特定の権力集団が勝手に変えられない。変えられないと合意したアルゴリズムがブロックチェーン技術である。また、トークン(Token)はブロックチェーンで作られたもので分配する時に使えるものである。暗号化貨幣はブロックチェーン世界でお互いに分配することに使われていて全てが記録される。スマート契約またはスマートコントラクト(ブロックチェーンを活用することで、取引に対して特定の条件が満たされた場合に、決められた処理を行うという技術)で、契約をはじめとした取引の自動化を実現することができるとされている。DAO(特定の所有者や管理者が存在せずとも、事業やプロジェクトを推進できる組織を指す言葉)と言われる合意アルゴリズムで運営されるフラットフォームを独占した企業が勝手にできないことになる。約束した規約、スマートコントラクトに記録された内容を元にDAOという合意アルゴリズムで利害関係者と合意をして決定しないといけない。それからすべての利害関係者が互いに公言したものはトークンで分配をしないといけない。これがトークンエコノミーである。
Web 3とブロックチェーンはお互いに繋がっていて、Web 3実現しようとしている内容でブロックチェーンを作ろうとした際には、Webやモバイルのような生態系が必要になる。Webとモバイルで実際にブロックチェーンを作って、You Tubeの代わりD.tubeというものを作ったが、分かる人も少ないし、使っている人もかなり少ない。いい哲学を元に公平に分配する仕組みで作ったものをなぜ使わないのか?既存の慣習や固定観念に慣れてしまった私たちがいるからである。BigTech企業がマーケットを牛耳っていて入り込む余地がないからである。
既存のレガシーにWeb 3というのは受け入れられない。なぜなら既存のBigTech企業がしっかり根をはっているし、ユーザーもこれに慣れているから動かないからである。
しかし、メタバースは新しい受け皿に十分になれる第3の世界である。メタバースの世界は空間があって立体的で人が動かないといけないし、数多くのアバターが存在する現実と酷似している。こういうことは利害関係がかなり複雑とも言える。だからWeb 3の公正という精神に合っているとも言える。現実世界にある法律などと同じくスマートコントラクトに記録されたブロックチェーンの記録がある。だから、Web 3を実現する空間としてメタバースが合っていると言える。だが、このメタバースは使いにくい。ここで必要なのがChatGPT、Generative AIである。4つ技術が一緒になって新しいフラットフォーム、新しい生態系が生まれる。これからメタバースに必要な様々なものをYou Tubeの動画をYou Tuberたちが作るように新たなクリエイターたちが作ることになる。これを公正に分配し、仲裁をするためにはスマートコントラクト、ブロックチェーン、Web 3の哲学が一緒ではないといけない。それからクリエイターたちが使うツールとして必要なのがChatGPT、Generative AIである。

メタバースマーケットで必要なハードウェアはHMDとインターネットに繋いでメタバースを実現するためにはネットワークのスピードも重要である。また、このようなデバイスに必要な多くのOS、ソフトウェアも重要であるし、これをマーケットに展開するためのサービスも重要である。このようなことを考慮して今後期待できる企業を予想するのも一つの楽しみである。

全世界でGoogleが検索でマーケット占有率1位をしているが、ロシア、中国、韓国の3つの国では1位ではない。ロシアと中国のように特殊な環境にいる国を除いて普通にGoogleの検索が使える国では韓国が唯一の国である。韓国はGoogleよりNaverがマーケット占有率1位である。韓国はITマーケットで独自に技術を成長していっている。ハードウェアではSamsungとLGが、ソフトウェアではNaverを含むソフトウェア会社が次なるマーケットを狙って動いているが日本はどうしているのか?ハードウェアでもソフトウェアでも韓国に勝っているとは言えない状況である。
2024年2月末にFacebook CEO マーク・ザッカーバーグが韓国のSamsungの会長とAI協力について話し合う予定だそうだ。AGIでも協業もありうると予想されている。Googleは最近「TPUv5p」という最新チップを自社のGeminiに適用したし、Microsoftは「Maia 100」を公開した。AI企業が自社のチップ開発に力をいれていることも明確になっているからだ。2024年1月OpenAI CEO サム・アルトマンが韓国のSamsungとSKハイニックスと話し合いをしたのも協業のためである。日本もこのままではいられない。ハードウェアでもソフトウェアでも遅れを取り戻せる技術力を持っている。ただ意思決定がいつも遅い。出るくぎは打たれるという意識を変えないといけない。打たれても先に前に出る素晴らしい企業や人を期待したい。