生成系 AI とは?
生成人工知能 (生成 AI) は、会話、ストーリー、画像、動画、音楽などの新しいコンテンツやアイデアを作成できる AI の一種です。AI テクノロジーは、画像認識、自然言語処理 (NLP)、翻訳などの従来とは異なるコンピューティングタスクで人間の知能を模倣しようとしています。生成系 AI は人工知能の次のステップです。人間の言語、プログラミング言語、芸術、化学、生物学、またはあらゆる複雑な主題を学習するようにトレーニングできます。トレーニングデータを再利用して新しい問題を解決します。例えば、英語の語彙を学習し、処理した単語から詩を作成できます。組織は、チャットボット、メディア制作、製品開発や設計など、さまざまな目的で生成系 AI を使用できます。
生成系 AI はなぜ重要なのか?
ChatGPT のような生成系 AI アプリケーションは、広く注目され、想像力をかき立てています。このようなアプリケーションは、ほとんどのカスタマーエクスペリエンスとアプリケーションを再発明し、これまでにない新しいアプリケーションを作成し、お客様が新たな生産性レベルに到達するのに役立ちます。
Goldman Sachs によると、生成系 AI は世界の国内総生産 (GDP) を 7% (約 7 兆 USD) 増加させる可能性があるということです。また、これにより 10 年間で生産性が 1.5% 上昇すると予想しています。
次に、生成系 AI のメリットをさらにいくつかご紹介します。
研究を加速する
生成系 AI アルゴリズムは、複雑なデータを新しい方法で探索および分析できます。そのため、研究者は、他の方法では明らかにならないかもしれない新しい傾向やパターンを発見することができます。このアルゴリズムにより、内容を要約し、複数のソリューションパスの概略を示し、アイデアをブレインストーミングし、研究メモから詳細な文書を作成することができます。これが、生成系 AI が研究とイノベーションを劇的に向上させられる理由です。
例えば、製薬業界では生成系 AI システムを使って、タンパク質配列を生成および最適化し、創薬を大幅に高速化しています。
カスタマーエクスペリエンスを改善する
生成系 AI は、人間の会話に自然に応答し、顧客サービスや顧客ワークフローのパーソナライズのためのツールとして機能します。
例えば、AI 搭載のチャットボット、ボイスボット、バーチャルアシスタントを使用すると、顧客に的確に応答して、ファーストコンタクトで解決することができます。厳選されたオファーやコミュニケーションをパーソナライズされた方法で提示することで、顧客エンゲージメントを高めることができます。
ビジネスプロセスを最適化する
生成系 AI を使用すると、あらゆる事業分野で機械学習 (ML) と AI アプリケーションを利用してビジネスプロセスを最適化できます。その技術は、エンジニアリング、マーケティング、カスタマーサービス、財務、営業など、あらゆる事業分野に応用できます。
例えば、生成系 AI が最適化のためにできることを次に挙げます。
- あらゆるソースからデータを抽出して要約し、ナレッジ検索を行えるようにする
- マーケティング、広告、財務、物流などの分野でコスト削減のためのさまざまなシナリオを評価して最適化します。
- 合成データを生成して、教師あり学習やその他の機械学習プロセス用のラベル付きデータを作成します。
従業員の生産性を向上させる
生成系 AI モデルは、従業員のワークフローを強化し、組織内の全従業員の効率性を高めるアシスタントになることができます。検索から作成まで、どのような作業も人間と同じように行えます。
生成系 AI は、次のように、さまざまなタイプの労働者の生産性を向上させることができます。
- 特定の入力や制約に基づいて複数のプロトタイプを生成することで、クリエイティブなタスクをサポートします。また、人間のフィードバックや特定の制約に基づいて既存の設計を最適化することもできます。
- アプリケーション開発タスクのための新しいソフトウェアコードの提案を行います。
- レポート、要約、予測を生成することで管理を支援します。
- マーケティングチーム向けの新しいセールススクリプト、E メールコンテンツ、ブログを生成します
時間を節約し、コストを削減し、組織全体の効率性を高めることができます。
生成 AI の仕組み
すべての人工知能と同様に、生成 AI は機械学習モデル、つまり膨大な量のデータで事前にトレーニングされた非常に大規模なモデルを使用して動作します。
基盤モデル
基盤モデル (FM) は、一般化されたデータやラベル付けされていないデータに基づいて広範囲にトレーニングされた ML モデルです。基盤モデルはさまざまな一般的なタスクを実行できます。
FM は、何十年にもわたって進化してきたテクノロジーにおける最新の進歩の結果です。一般に、FM は学習したパターンと関係を使用してシーケンス内の次の項目を予測します。
たとえば、画像生成では、モデルが画像を分析し、より鮮明で明確に定義された画像を作成します。同様に、テキストの場合、モデルは前の数単語とそれらのコンテキストに基づいて、テキスト文字列内の次の単語を予測します。次に、確率分布手法を使用して次の単語を選択します。
大規模言語モデル
大規模言語モデル (LLM) は FM の 1 つのクラスです。例えば、OpenAI の事前トレーニング済み生成トランスフォーマー (GPT) モデルは LLM です。LLM は、要約、テキスト生成、分類、自由形式の会話、情報抽出などの言語ベースのタスクに特に重点を置いています。
LLM が特別なのは、複数のタスクを実行できる点です。これを実現できるのは、高度な概念を学習できるようにする多くのパラメータが含まれているからです。
GPT-3 のような LLM は、何十億ものパラメータを考慮でき、ごくわずかな入力からコンテンツを生成できます。事前トレーニングでさまざまな形式や無数のパターンのインターネット規模のデータに触れることで、LLM は幅広いコンテクストで知識を応用することを学習します。
生成 AI は産業にどのような影響を与えるか?
生成 AI は、長期的にすべての業界に影響を与える可能性がありますが、特定の業界ではこのテクノロジーからすぐに恩恵を受ける環境が整っています。
金融サービス
金融サービス企業は、生成 AI のパワーを活用して、コストを削減しながら顧客により良いサービスを提供することができます。
- 金融機関はチャットボットを使用して商品の推奨を生成し、顧客からの問い合わせに対応できるため、顧客サービス全体が向上します
- 融資機関は、特に発展途上国の金融サービスが行き届いていない市場で、FM を使用して融資の承認を早めることができます
- 銀行は、請求やクレジットカードやローンの不正行為を迅速に検出できます。
- 投資会社は生成 AI の力を利用して、顧客に安心できパーソナライズされた財務アドバイスを低コストで提供することができます。
ヘルスケアおよびライフサイエンス
生成 AI の最も有望なユースケースの 1 つは、創薬と研究を加速することです。生成 AI は、モデルを使用して特定の特性を持つ新しいタンパク質配列を作成し、抗体、酵素、ワクチン、遺伝子治療を設計します。
ヘルスケアおよびライフサイエンス企業は、生成モデルを使用して、合成生物学や代謝工学に応用するための合成遺伝子配列を設計できます。例えば、バイオ製造を目的として、新しい生合成経路を作成したり、遺伝子発現を最適化したりすることができます。
最後に、生成 AI を使用して、患者とヘルスケアの合成データを作成できます。これは、AI モデルのトレーニング、臨床試験のシミュレーション、または大規模な現実世界のデータセットにアクセスせずに希少疾患を研究するのに役立ちます。
自動車と製造
自動車会社は、エンジニアリングから車載エクスペリエンス、カスタマーサービスまで、さまざまな目的に生成 AI 技術を使用できます。例えば、機械部品の設計を最適化して車両設計における抵抗を軽減したり、パーソナルアシスタントの設計を適応させたりすることができます。
自動車会社は生成 AI を活用して、顧客からのよくある質問にすばやく回答することで、より良いカスタマーサービスを提供しようとしています。生成 AI を使用して新しい材料、チップ、部品の設計を作成することで、製造プロセスを最適化し、コストを削減できます。
生成 AI は、アプリケーションをテストするための合成データ生成にも使用できます。これは、テストデータセットに含まれることが少ないデータ (欠陥やエッジケースなど) に特に役立ちます。
メディアとエンターテインメント
アニメーションや脚本から完全版の映画まで、生成 AI モデルは斬新なコンテンツを、従来の制作にかかるコストと時間の数分の一で制作できます。
業界における生成 AI の他の利用方法は次のとおりです。
- アーティストは、AI で生成された音楽でアルバムを補完および強化し、まったく新しいエクスペリエンスを生み出すことができます
- メディア組織は、生成 AI を使用してパーソナライズされたコンテンツや広告を提供することで視聴者体験を改善し、収益を増やすことができます
- ゲーム会社は、生成 AI を使用して新しいゲームを作成したり、プレーヤーがアバターを作成できるようにしたりできます
電気通信
通信における生成 AI の初期のユースケースは、カスタマーエクスペリエンスの再発明に重点を置いています。カスタマーエクスペリエンスは、カスタマージャーニーのあらゆるタッチポイントにおけるサブスクライバーの累積的なインタラクションで形作られます。
例えば、通信組織は生成 AI を応用して、ライブの人間のような会話エージェントを使用して顧客サービスを向上させることができます。また、ネットワークデータを分析して修正を推奨することで、ネットワークパフォーマンスを最適化することもできます。また、パーソナライズされた 1 対 1 のセールスアシスタントにより、顧客関係を再構築できます。
エネルギー
生成 AI は、複雑な未加工データ分析、パターン認識、予測、最適化を含むエネルギー部門のタスクに適しています。エネルギー企業は、企業データを分析して使用パターンを特定することで、顧客サービスを改善できます。この情報を利用して、対象を絞った製品提供、エネルギー効率化プログラム、需要対応イニシアチブを開発できます。
生成 AI は、貯留層シミュレーションを通じて、グリッド管理、運用現場の安全性の向上、エネルギー生産の最適化に役立ちます。
生成 AI モデルの仕組み
従来の機械学習モデルは、識別的であったり、データポイントの分類に重点が置かれていたりし、既知の要因と未知の要因の関係を特定しようとしました。例えば、ピクセルの配置、線、色、形状などの既知のデータである画像を見て、未知の要素である単語にマッピングします。数学的には、これらのモデルは、未知の要因と既知の要因を x 変数と y 変数として数値的にマッピングできる方程式を特定することで機能しました。
生成モデルはこれをさらに一歩進めます。特定の特徴が与えられたときにラベルを予測するのではなく、特定のラベルが与えられたときに特徴を予測しようとします。数学的には、生成モデリングは x と y が同時に発生する確率を計算します。さまざまなデータの特徴の分布とそれらの関係を学習します。
例えば、生成モデルは動物の画像を分析して、さまざまな耳の形、目の形、尾の特徴、皮膚のパターンなどの変数を記録します。それぞれの動物の特徴や関係を学び、さまざまな動物が一般的にどのような姿形をしているのかを理解します。その後、トレーニングセットに含まれていなかった新しい動物の画像を再現できます。
次に、生成 AI モデルの大まかなカテゴリーをいくつか示します。
拡散モデル
拡散モデルは、初期データサンプルに制御されたランダムな変更を繰り返し加えることにより、新しいデータを作成します。元のデータから始めて微妙な変化 (ノイズ) を加え、徐々に元のデータとの類似度が低下していきます。このノイズは、生成されたデータが一貫性があり現実的な状態に保たれるように注意深く制御されています。
数回反復してノイズを追加した後、拡散モデルはプロセスを逆転させます。逆のノイズ除去によりノイズが徐々に除去され、元のデータに似た新しいデータサンプルが生成されます。
敵対的生成ネットワーク
敵対的生成ネットワーク (GAN) は、拡散モデルの概念に基づいて構築された別の生成 AI モデルです。
GAN は、2 つのニューラルネットワークを競争的にトレーニングすることで機能します。ジェネレーターと呼ばれる最初のネットワークは、ランダムノイズを追加して偽のデータサンプルを生成します。ディスクリミネーターと呼ばれる 2 つ目のネットワークは、実際のデータとジェネレーターが生成する偽のデータを区別しようとします。
トレーニング中、ジェネレーターは現実的なデータを作成する能力を継続的に向上させ、一方ディスクリミネーターは本物と偽物の見分け方が上達します。この敵対的なプロセスは、ディスクリミネーターが実際のデータと区別できないほど説得力のあるデータを生成するまで続きます。
GAN は、リアルな画像の生成、スタイル転送、およびデータ拡張タスクに広く使用されています。
変分オートエンコーダー
変分オートエンコーダー (VAE) は、潜在空間と呼ばれるデータのコンパクトな表現を学習します。潜在空間は、データを数学的に表現したものです。これは、すべての属性に基づいてデータを表す一意のコードと考えることができます。例えば、顔を学習する場合、潜在空間には目の形、鼻の形、頬骨、耳を表す数字が含まれます。
VAE は、エンコーダーとデコーダーの 2 つのニューラルネットワークを使用します。エンコーダーニューラルネットワークは、入力データを潜在空間の各次元の平均と分散にマッピングします。ガウス (正規) 分布からランダムサンプルを生成します。このサンプルは潜在空間のポイントであり、入力データを圧縮して簡略化したものです。
デコーダーニューラルネットワークは、このサンプリングされたポイントを潜在空間から取得し、元の入力に似たデータに再構築します。数学関数を使用して、再構築されたデータが元のデータとどの程度一致しているかを測定します。
トランスフォーマーベースのモデル
トランスフォーマーベースの生成 AI モデルは、VAE のエンコーダーとデコーダーの概念に基づいています。トランスフォーマーベースのモデルは、エンコーダーにレイヤーを追加して、理解、翻訳、クリエイティブライティングなどのテキストベースのタスクのパフォーマンスを向上させます。
トランスフォーマーベースのモデルはセルフアテンションメカニズムを使用しています。シーケンス内の各要素を処理する際に、入力シーケンスのさまざまな部分の重要性を比較検討します。
もう 1 つの重要な特徴は、これらの AI モデルがコンテキスト埋め込みを実装していることです。シーケンス要素のエンコーディングは、要素自体だけでなく、シーケンス内のコンテキストにも依存します。
トランスフォーマーベースのモデルの仕組み
トランスフォーマーベースのモデルがどのように機能するかを理解するには、文を一連の単語として想像してみてください。
セルフアテンションは、モデルが各単語を処理する際に関連する単語に集中するのに役立ちます。単語間のさまざまなタイプの関係を捉えるために、トランスフォーマーベースの生成モデルでは、アテンションヘッドと呼ばれる複数のエンコーダーレイヤーを採用します。各ヘッドは、入力シーケンスのさまざまな部分に注意を向けることを学びます。これにより、モデルはデータのさまざまな側面を同時に検討できます。
各レイヤーはコンテキスト埋め込みも調整します。レイヤーを使うと、埋め込みに情報が提供され、文法構文から複雑な意味まですべてをキャプチャできます。
生成 AI 技術はどのように進化してきたのか?
プリミティブ生成モデルは、数値データ分析を支援するために統計学で何十年も用いられてきました。ニューラルネットワークと深層学習は、モダンな生成 AI の呼び水になりました。2013 年に開発された変分オートエンコーダー (VAE) は、リアルな画像と音声を生成できる最初の深層生成モデルでした。
VAE により、複数のデータ型の新しいバリエーションを作成できるようになりました。これにより、敵対的生成ネットワークや拡散モデルなど、他の生成 AI モデルが次々に登場しました。このようなイノベーションの重点は、人工的に作成されたにもかかわらず、実際のデータにより近いデータを生成することに置かれていました。
2017 年、トランスフォーマーの導入により、AI 研究にさらなる新風が吹きました。トランスフォーマーにより、エンコーダーとデコーダーのアーキテクチャがアテンションメカニズムとシームレスに統合されました。トランスフォーマーは言語モデルのトレーニングプロセスを非常に効率的かつ汎用的に合理化しました。GPT のような注目すべきモデルは、幅広い未加工テキストのコーパスで事前トレーニングを行い、さまざまなタスクに合わせて微調整できる基盤モデルとして登場しました。
トランスフォーマーは、自然言語処理の可能性を変えました。これにより、翻訳や要約から質問への回答まで、さまざまなタスクに対応する生成機能が強化されました。
多くの生成 AI モデルは大きな進歩を続けており、業界を超えた応用の仕方が見出されました。最近のイノベーションは、独自のデータを処理するようにモデルを改良することに重点を置いています。研究者はまた、ますます人間に近いテキスト、画像、動画、音声を作成したいと考えています。
生成 AI を採用する際のベストプラクティスとは?
組織が生成 AI ソリューションを実装したい場合は、以下のベストプラクティスにより取り組みを強化することをご検討ください。
社内アプリケーションから始める
生成 AI の採用は、プロセスの最適化と従業員の生産性に重点を置いた社内アプリケーションを開発するところから始めるのが最適です。より制御された環境で結果をテストしながら、スキルとテクノロジーの理解を深めることができます。モデルを広範囲にテストし、社内のナレッジソースでカスタマイズすることもできます。
こうすることで、最終的にモデルを外部アプリケーションに使用するときに、顧客のエクスペリエンスが大幅に向上します。
透明性を高める
すべての生成 AI アプリケーションとアウトプットについて明確に伝えることで、ユーザーは自分が人間ではなく AI と対話していることを知ることができます。例えば、AI は自らを AI として紹介したり、AI ベースの検索結果をマークして強調表示したりできます。
そうすれば、ユーザーは自分の判断でコンテンツを利用できるようになります。また、トレーニングデータの制限により基礎となるモデルに生じる可能性のある不正確さや隠れたバイアスに、ユーザーはより積極的に対処できるようになる可能性があります。
セキュリティを実装する
ガードレールを実装して、生成 AI アプリケーションで機密データへの不注意による不正アクセスが許可されないようにしましょう。最初からセキュリティチームを巻き込んで、最初から全側面を検討できるようにしましょう。例えば、内部データでモデルをトレーニングする前に、データをマスクして個人を特定できる情報 (PII) を削除する必要がある場合があるでしょう。
広範囲にわたりテストする
自動および手動のテストプロセスを開発して結果を検証し、生成 AI システムが経験する可能性のあるあらゆる種類のシナリオをテストしましょう。さまざまなベータテスターのグループを用意して、さまざまな方法でアプリケーションを試し、結果を文書化しましょう。また、テストを通じてモデルが継続的に改善され、期待される結果や応答をより細かく制御できるようになります。
生成系 AI の一般的な用途にはどのようなものがあるか?
生成系 AI を使用すると、機械学習をより迅速にビジネスに活用し、より幅広いユースケースに適用できます。生成系 AI は、エンジニアリング、マーケティング、カスタマーサービス、財務、営業など、あらゆる事業分野に適用できます。コードの生成は、生成 AI の最も有望なアプリケーションの 1 つであり、生成 AI を活用したソフトウェア開発のためのアシスタントである Amazon Q Developer により、デベロッパーの生産性が大幅に向上しています。
コード生成以外にも、生成系 AI を活用してカスタマーエクスペリエンス、従業員の生産性、ビジネス効率、創造性を段階的に変えることができる用途はたくさんあります。生成系 AI を使用すると、チャットボット、バーチャルアシスタント、インテリジェントコンタクトセンター、パーソナライズ、コンテンツモデレーションなどの機能を通じてカスタマーエクスペリエンスを向上させることができます。生成系 AI を活用した会話型検索、コンテンツ作成、テキストの要約などにより、従業員の生産性を向上させることができます。インテリジェントな文書処理、メンテナンスアシスタント、品質管理と目視検査、および合成トレーニングデータの生成により、ビジネス運営を改善できます。最後に、生成系 AI を使用して、テキスト、アニメーション、動画、画像の生成により、アートや音楽など、あらゆる種類のクリエイティブコンテンツの制作を加速できます。
AWS は生成系 AI をどのように支援できますか?
Amazon Web Services (AWS) では、データ、ユースケース、顧客向けの生成系 AI アプリケーションを簡単に構築してスケーリングできます。AWS での生成 AI を使用すると、エンタープライズグレードのセキュリティとプライバシー、業界をリードする FM へのアクセス、生成 AI を活用したアプリケーション、データファーストのアプローチを実現できます。
生成 AI の採用と成熟度の各段階であらゆるタイプの組織をサポートする幅広い生成 AI サービスの中からお選びください:
- コード生成は、生成系 AI の最も有望な活用法の 1 つです。ソフトウェア開発のための生成 AI 搭載アシスタントである Amazon Q Developer の使用により、開発者の生産性向上で大きな成果を挙げることができます。
- Amazon Bedrock は、高性能な FM の選択肢と幅広い機能を提供するもう 1 つのフルマネージド型サービスです。さまざまなトップ FM を簡単に試したり、データを使って個人的にカスタマイズしたりして、複雑なビジネスタスクを実行するマネージドエージェントを作成できます。
- Amazon SageMaker JumpStart を使用すると、オープンソースの FM を発見、調査、デプロイしたり、独自の FM を作成したりすることもできます。Amazon SageMaker JumpStart ではスケーラブルで信頼性が高く安全なモデル構築、トレーニング、デプロイを加速するためのマネージドインフラストラクチャとツールが用意されています。
- AWS HealthScribe は HIPAA の対象となるサービスであり、医療ソフトウェアベンダーが患者と臨床医の会話を分析して臨床ノートを自動的に生成する臨床アプリケーションを構築できるようにします。AWS HealthScribe は、音声認識と生成系人工知能 (AI) を組み合わせて、患者と臨床医の会話を書き起こし、レビューしやすい臨床メモを生成することで、臨床ドキュメントを用意する負担を軽減します。
- QuickSight の Amazon Q を使用すると、ビジネスアナリストは自然言語コマンドを使用してビジュアルを簡単に作成およびカスタマイズできます。新しい生成 BI オーサリング機能により、QuickSight Q の自然言語クエリは、構造化された質問 (「カリフォルニアで販売されている上位 10 の製品は何か」など) への回答にとどまりません。アナリストが質問の断片 (「トップ 10 製品」など) からカスタマイズ可能なビジュアルをすばやく作成したり、フォローアップの質問をしてクエリの意図を明確にしたり、視覚化を微調整したり、複雑な計算を実行したりできます。
今すぐアカウントを作成して、AWS で生成 AI の使用を開始しましょう。