AIモデルのトレーニングの概要とその重要性

Mike Chen | コンテンツ・ストラテジスト | 2023年10月6日

この記事の内容

大衆文化において、AIは悪者扱いされることがあります。映画ではロボットの黙示録への第一歩として描かれ、一方ニュースではAIがすべての仕事を奪うという話題でもちきりです。実際のところ、AIは以前から存在しており、どちらの最悪のシナリオも差し迫ったものである可能性はまずありません。

基本的に、AIはデータを使用して予測を行います。この機能は、ストリーミング・サービスの「こちらもおすすめ」情報の提供に役立っている可能性があるほか、自然言語のクエリを理解して正解を予測するチャットボットや、写真を見て顔認識機能を使用して写っている人物を推測するアプリケーションにも活用されています。しかし、これらの予測に到達するには、効果的なAIモデルのトレーニングが必要であり、AIに依存する新しいアプリケーションは、学習に対して少し異なるアプローチを要することがあります。

AIモデルのトレーニングとは

AIモデルの核心は、選択されたアルゴリズムのセットと、それらのアルゴリズムが最も正確な予測を行えるようにトレーニングする際に使用するデータの両方です。シンプルなモデルの場合、1つのアルゴリズムしか使用していないため、2つの用語が重複する場合もありますが、モデル自体はトレーニング後の出力となります。

数学的な意味では、アルゴリズムは未定義の係数を持つ方程式とみなすことができます。選択されたアルゴリズムがデータセットを消化し、どのような係数の値が最も適合するかを決定することで、予測用のモデルが作成されます。「AIモデルのトレーニング」とは、アルゴリズムにデータを与え、結果を検証し、精度と有効性を高めるためにモデル出力を微調整する、このプロセスを指します。これを行うために、アルゴリズムには、入力されるさまざまなデータをすべて取得する大量のデータが必要です。

外れ値、驚き、矛盾、一見すると意味をなさないパターン...アルゴリズムは、入力されるデータセット全体にわたり、こうしたものすべてに繰り返し対処する必要があります。このプロセスは学習の基礎であり、パターンを認識し、文脈を理解し、適切な意思決定を行う機能です。十分にAIモデルをトレーニングすることで、モデル内の一連のアルゴリズムは、予測可能性を最大限に高めつつ、予期せぬ事態に対する許容範囲を組み込んだ、与えられた状況に対する数学的予測モデルを表します。

主なポイント

AIモデルのトレーニングは、クエリに対する正確な応答を生成するためのシステムの改良を支援するために、キュレーション・データを選択したアルゴリズムに供給するプロセスです。
利用可能なAIアルゴリズムには多くの種類があり、プロジェクトの範囲、予算編成、リソース、目標によって適切なものが異なります。
効果的なAIモデルのトレーニングには、質の高い、キュレーションされた大量のトレーニング・データが必要となります。
AIモデルのトレーニングとテストは、フィードバックと結果に基づく反復プロセスです。
トレーニングされたAIモデルがトレーニング・データセットとテスト・データセットで一貫した結果を出すと、プロセスは最終的に稼働する前に、実際のデータを使ったテストに移ります。

AIモデルのトレーニングについての説明

AIモデルのトレーニングは反復プロセスであり、その成否はインプットの質と深さ、そしてモデルをトレーニング担当者が欠陥を特定し補う機能によります。ビジネス・ユーザーであっても、ローコード/コード不要の環境であれば関与できる場合もありますが、通常はデータ・サイエンティストがトレーニング・プロセスを扱います。実際、処理、観察、フィードバック、改善のサイクルは、子供に新しいスキルを教えることに似ています。AIモデルのトレーニングでは、データ内のさまざまな可能性のある変数、異常値、複雑さのバランスを取りながら、正確に出力を作成する数学的モデルを作成することが目標です。考えてみれば、子育ては似ていますが、はるかに厄介なジャーニーです。

子どもがスキルを習得する方法を考えてみましょう。基本的な写真を使用して、犬と猫の一般的な違いを確認します。最初は基本的な写真と励ましから始まります。次に、平均的な大きさ、吠え声と鳴き声の違い、行動パターンなど、より詳細な変数を導入します。子供が苦手とする可能性のある分野に基づいて、特定の分野に重点を置いて学習を支援することができます。このプロセスが終わる頃には、幼児は一般的な家庭のペットから野生動物まで、あらゆる種類の犬や猫を識別できるようになっているはずです。

AIモデルのトレーニングも同様です。

AI:モデルとなるアルゴリズムと初期トレーニング・データセットを選択します。

子供: 基本的な写真を使用して、犬と猫の一般的な違いを確認します。
AI:出力精度を評価し、特定の不正確さを軽減または排除するためにモデルを調整します。

子供:答えに応じて、褒めたり訂正したりします。
AI:特定のさまざまなインプットを持つ追加のデータセットを提供し、モデルのカスタマイズとファインチューニングを行います。

子供: 学習プロセスの一環として、さまざまな特徴、形状、サイズを強調表示します。

子供と同じように、最初のAIモデルのトレーニングは、その後の展開に大きな影響を与えることがあり、不適切な影響を排除するためにさらなるレッスンが必要な場合もあります。このことは、初期トレーニングおよびモデルをトレーニングした後の継続的な反復学習の両方において、高品質データ・ソースの重要性を明確に示しています。

ビジネスにおけるAIモデルの価値

分析を生成したり、データの異常値を明らかにしたり、テキスト認識や自然言語処理を使用するアプリケーションによって、ほとんどの組織はすでにワークフローやプロセス内でAIのメリットを享受しています。たとえば、紙の領収書やドキュメントをデータ記録に変換することが考えられます。しかし、多くの組織は、特定の重要なニーズに対応する目的でAIモデルを開発しようとしています。開発プロセスそのものが、プロセスの迅速化などの短期的価値から、これまで隠されていたインサイトの発見や新しい製品やサービスの立ち上げなどの長期的利益に至るまで、より深いレベルのメリットをもたらす可能性があります。

AIをサポートできるインフラストラクチャに投資する主な理由は、ビジネスの成長方法にあります。簡単に言えば、データはいたるところにあります。あらゆる方向から多くのデータが入ってくるため、社内運用や営業マーケティング・チームのパフォーマンスなど、組織のほぼすべての部分に新しいインサイトを生成できます。そのことを念頭に置いて、適切なトレーニングと慎重な適用により、AIはほぼすべての状況でビジネス上の価値を提供することができます。

組織が最大限の利益を得るためにAIをトレーニングする方法を考えるには、最初のステップとして、インプットと確実な意思決定に必要なものを特定する必要があります。たとえば、製造サプライ・チェーンについて考えてみます。適切にトレーニングされたAIシステムがすべての関連データを利用できるようになれば、出荷コストの計算、市場投入までの時間や品質・欠陥率の予測、市場状況に基づく価格変更の推奨など、多くのタスクを実行できるようになります。大量の受信データとデータに基づく意思決定の必要性を併せ持つサプライチェーンは、AIによる問題解決に適しています。一方、ソフトスキルが最優先事項のままである場合、AIはサポート情報を提供することはできますが、革新的な変化をもたらす可能性は低いでしょう。例として、年次レビュー時におけるマネージャーの従業員業績評価が挙げられます。この場合、AIは指標の収集を容易にする可能性はありますが、人間と人間のやりとりに基づく評価に取って代わることはできません。

AIへの投資を最大限に活用するには、組織は次のことを考慮する必要があります。

解決すべき問題とは何でしょうか。
これらの問題を解決するためのインプットを提供できる高品質なデータソースは存在するのでしょうか。
必要な処理をサポートし、関連するデータソースを連携させるインフラストラクチャは備わっているでしょうか。

これらのパラメータを設定することで、組織はAIの恩恵を受ける可能性が最も高いビジネス分野を特定し、それを実現するための措置を講じ始めることができます。

AIモデルのトレーニング・プロセス

プロジェクトごとに独自の課題や要件がありますが、AIモデルをトレーニングするための一般的なプロセスは変わりません。

以下の5つのステップが、AIモデルをトレーニングするための概要です。

データの準備:AIモデルのトレーニングを成功させるには、実際の状況を正確かつ一貫して表現する高品質なデータから始めます。これがなければ、得られる結果は無意味です。成功のためには、プロジェクト・チームは適切なデータソースをキュレーションし、手動および自動のデータ収集プロセスとインフラストラクチャを構築し、適切なクリーニング/変革プロセスを確立する必要があります。
トレーニング・モデルの選択:データのキュレーションがプロジェクトの土台を提供する場合、モデルの選択はメカニズムを構築します。この決定の変数には、プロジェクト・パラメータと目標の定義、アーキテクチャの選択、モデル・アルゴリズムの選択などがあります。トレーニング・モデルごとに必要なリソースは異なるため、これらの要素を、コンピュート・リソース、納期、コスト、複雑さといった実際の要素と比較検討する必要があります。
初期トレーニングの実行:上記の例で子供に猫と犬の見分け方を教えているように、AIモデルのトレーニングは基本から始まります。データセットの幅が広すぎたり、アルゴリズムが複雑すぎたり、モデルの型が間違ったりものを使用すると、学習や改善ではなく、単にデータを処理するだけのシステムになる可能性があります。最初のトレーニングでは、データ・サイエンティストは、アルゴリズム違反のミスに注意しながら、期待されるパラメータ内で結果を出すことに集中する必要があります。無理のないトレーニングを行うことで、モデルを着実に、確実なステップで改善することができます。
トレーニングの検証:モデルが最初のトレーニング・フェーズを通過すると、主な基準全てにおいて期待される結果を確実に作成します。トレーニングの検証は次のフェーズです。ここでは、エキスパートがアルゴリズムの問題点、意外性、ギャップを明らかにする取り組みとして、モデルに適切な課題を与えます。この段階では、初期フェーズとは別のデータセットを使用しており、通常、トレーニング・データセットよりも幅が広く複雑です。

データ・サイエンティストはこれらのデータセットでパスを実行しながら、モデルのパフォーマンスを評価します。力の精度も重要ですが、プロセス自体も同様に重要です。プロセスの最優先事項には、正確な予測の割合である精度や、正確なクラス識別の割合である再現率などの変数が含まれます。場合によっては、結果を指標値で判断することもできます。たとえば、F1スコアは、さまざまなタイプの誤検出/ネガティブの重みを組み込んだ分類モデルに割り当てられる指標で、モデルの成功をより総合的に解釈することができます。
モデルのテスト:キュレーショノされたデータ・セットと目的に合ったデータ・セットを使用してモデルの検証後は、ライブ・データを使用してパフォーマンスと精度をテストすることができます。この段階で使用するデータセットは、実際のシナリオから抽出する必要があります。これは、モデルを自力で飛行させるという、ことわざで言うところの「トレーニング・ホイールを外す」ステップです。テスト・データでモデルの結果が正確で、さらに重要なこととして期待通りのものであれば、稼働の準備は完了です。モデルに何らかの欠陥が見られた場合は、モデルがパフォーマンス基準を満たすか上回るまでトレーニングプロセスを繰り返します。

稼働は重要なマイルストーンですが、その段階を達成してもモデルのトレーニングが終了したわけではありません。モデルによっては、処理されるデータセットがAIにとって新たな「レ��スン」となり、アルゴリズムのさらなる改善と改良につながります。データ・サイエンティストは、特にモデルが予期しない異常値データを処理する場合、パフォーマンスと結果をモニターし続ける必要があります。不正確な結果が出た場合、たとえ稀なケースであっても、モデルは将来の出力に影響を与えないよう、さらに微調整が必要になることがあります。

AIモデルのトレーニング方法のタイプ

AIのトレーニングは、複雑さ、結果の種類、機能、処理能力など、さまざまな形式で行われます。ある方法では必要以上のリソースを使用する場合があり、またあるケースでは、より多くのドキュメントが提供されるまで「いいえ」という条件付きのような、より定性的な結果を必要とする状況で、ローン承認に対する「はい」か「いいえ」のような二値応答を提供する場合があります。

AIモデルに使用している手法の選択は、目標とリソースの両方を考慮する必要があります。綿密な計画なしに進めると、データサイエンスチームは最初からやり直すことになり、時間とコストを浪費することになります。

ディープ・ニューラル・ネットワーク

AIモデルの中には、ルールと入力を使用して意思決定を行うものもありますが、ディープ・ニューラル・ネットワークは、さまざまなデータ関係に基づく複雑な意思決定を処理する機能を提供します。ディープ・ニューラル・ネットワークは、データポイント間のパターンと重み付けされた関係を識別する多数のレイヤーで機能し、予測出力や情報に基づく評価を行います。ディープ・ニューラル・ネットワークの例としては、AppleのSiriやAmazonのAlexaのような音声で起動するアシスタントが挙げられます。

線形回帰

統計では、入力と出力の関係を決定するために線形回帰が使用されます。最もシンプルな形では、代数式 y = Ax + B で表すことができます。このモデルは、データセットを使用して、入力、出力、および可能な変数係数に基づいてその数式を作成します。予測に使用する最終モデルは、入力と出力の間の線形関係を前提とします。線形回帰のユースケース例は、過去のセールス・データに基づく売上予測です。

ロジスティック回帰

統計学の分野から取られたロジスティック回帰は、バイナリの状況に効果的なモデルです。ロジスティック回帰は、確率を計算するためによく使用されているS字カーブ方程式であるロジスティック関数に基づいています。AIモデルの場合、ロジスティック回帰は確率を決定し、最終的に予測を行ったり、たとえば申請者にローンを承認すべきかどうかを決定したりするために、バイナリ結果を提供します。ロジスティック回帰のユースケースの例としては、不正検出を行う金融関連のアプリケーションがあります。

決定木

AI以外でも、ほとんどの人が決定木を経験しています。意思決定木は、フローチャートのノードに似た働きをします。機械学習では、トレーニング・プロセスが反復データをツリーにフィードして、ノードを追加するタイミングと、異なるノード・パスの送信先を特定します。意思決定木のユースケースの例には、ローンの承認があります。

ランダム・フォレスト

意思決定木は、深さを設定しすぎることで、トレーニング・セットに対してオーバーフィッティングになる可能性があります。ランダムフォレスト技術は、意思決定木のグループ（「フォレスト」という用語の由来）を組み合わせて、結果の最大のコンセンサスまたは加重平均を見出すことによって、それを補います。ランダムフォレストのユースケース例としては、カスタマー・プロファイルの異なる要素全体におよぶさまざまな意思決定木に基づいて、顧客の行動を予測することが挙げられます。

教師あり学習

子供の教育用語では、教師あり学習とは、子供が決められたカリキュラムに沿って体系的な授業を受けることにあたります。AIモデリングでは、確立されたトレーニング・データセットと定義されたパラメータを使用してモデルをトレーニングすることを意味し、データ・サイエンティストはトレーニング・データセットのキュレーション、テスト・データセットの実行、モデルのフィードバックを提供する際に、教師の役割を果たします。教師あり学習のユースケースの例としては、肺のX線写真から異常な細胞を見つけることが挙げられます。トレーニング・セットとして、異常のあるX線写真とないX線写真を使用し、モデルに対しその違いを示します。

教師なし学習

引き続き児童教育に例えると、教師なし学習は、子供たちにさまざまな可能性を提示し、好奇心に基づいて自主的に判断する自由を与えるモンテッソーリの哲学に似ています。AIモデルの場合、これはパラメータや目標なしでラベル付きではないデータセットを取り込むことを意味します。教師なし学習のユースケース例としては、小売業者が顧客行動の相関関係を見つけることを目的として、AIモデルに四半期ごとのセールス・データを入力することが挙げられます。

強化学習

これまでおやつを使って望ましい行動に誘導したことがあれば、それは強化学習を経験したことになります。AIレベルでは、強化学習は、ポジティブまたはネガティブな強化につながる実験的な決定から始まります。時間が経つと、AIは状況を処理し、ポジティブな強化を最大化するための最良の意思決定、つまり最も正確な意思決定や成功した意思決定を学習します。強化学習のユースケース例としては、YouTubeが視聴履歴に基づいて提示する「あなたへのおすすめ」リストがあります。

転移学習

AIモデルは、異なる状況への適用により成功を収めることがあります。転移学習は、新しいモデルの出発点として既存のAIモデルを使用する方法を指します。この再利用は、既存のモデルが通常シナリオを処理する場合に最も有効であり、具体的すぎると再トレーニングが困難になる可能性があります。転移学習のユースケースの例としては、既存の画像分類モデルのパラメータに基づいて、特定の画像分類のために新しいAIモデルを作成することが挙げられます。

半教師あり学習

教師あり学習と教師なし学習の両方の原理を使用している半教師あり学習は、少数のラベル付きデータセットでモデルをトレーニングすることから始まります。そこから、モデルはラベル付けおよびキュレーションされていないデータセットを使用して、パターンを改善し、予想外のインサイトを作成します。通常、半教師付き学習では、最初の数ステップだけ、補助輪のようにラベル付きデータセットを使用します。その後は、ラベル付きではないデータを多用します。半教師あり学習のユースケース例として、教師なしテキスト・ドキュメントを大量に入力する前に、キュレーションされたセットを使用して基本パラメータを確立するテキスト分類モデルがあります。

生成モデル

生成モデルは教師なしAI手法の1つで、非常に大規模な例データセットを使用してプロンプト出力を作成します。この例としては、画像アーカイブのメタデータに基づくAIが生成した画像や、入力された文章のデータベースに基づく予測テキストがあります。生成モデルの結果は、単にデータを分類して出力するのではなく、何千、場合によっては何百万もの例データを使用して学習し、独自の出力を作成することができます。生成モデルのユースケースの例は、ChatGPTのようなチャットボットです。

AIモデルのトレーニングにおけるデータの役割

AIモデルを適切にトレーニングするためには、データが必要です。AIモデルを適切にトレーニングするためには、データが必要です。データがなければ、モデルは学習できません。また、高品質なデータがなければ、モデルは誤った内容を学習します。したがって、データ・サイエンティストは、目的を持って慎重にプロジェクト・データセットを選択します。

データセットのキュレーションは、最適なAIモデルをトレーニングするために以下の要素を含む必要があります。

データソースの品質:AIモデルに、吟味されていない、均質で、質の低いデータセットが大量に供給されると、得られる結果は不十分なものになります。何をもって「良いデータ」とするかはモデルによって異なります。許容できないレベルの不正確さがある場合、AIをバックトラックして再トレーニングすることが可能な場合があります。しかし、データ・サイエンティストは、不適切なデータによってモデルに悪影響を及ぼした後、プロジェクトを最初からやり直すことも珍しくありません。
データ量:AIモデルのトレーニングでは実践が重要です。最初のステップは1つのデータセットで十分な場合もありますが、トレーニング・プロセスでは、モデルを改善し、精度を高め、異常値データを特定するために、大量のデータだけでなく、適切なレベルの多様性と粒度が必要となります。
データの多様性:データセットの多様性が高いほど、AIモデルのトレーニングの精度が向上することがよくあります。実世界と同様に、さまざまな経験は機能を��張し、より深い知識により意思決定の効率化が可能になります。

AIモデルのトレーニングにおける課題

AIモデルのトレーニングには、独自の課題が伴います。その中には、ロジスティクス（インフラストラクチャ、処理能力、スタートからゴールまでのその他の実用的な検討事項）関連の課題もあります。その他の課題は、先入観を緩和し、結果として得られるシステムを客観的なものに保つ方法についての理解を深めるなど、データ・サイエンティスト側の内省を必要とします。

AIモデルをトレーニングする際に考慮すべき課題は次のとおりです。

データの先入観: AIモデルから正確な結果を得るためには、トレーニングに高品質のデータが必要となります。データの先入観を軽減するために、データ・サイエンティストはトレーニング・データセットをキュレーションする前に、データソースを徹底的に吟味する必要があります。
適切なデータ:トレーニング・データセットには、適切な多様性と粒度を持つ大量のデータが必要です。これにより、大量の高品質データのキュレーションがチームに求められるだけでなく、多くの実用的な考慮事項が生じます。これにより、大量の高品質データのキュレーションがチームに求められるだけでなく、多くの実用的な考慮事項が生じます。
処理能力とインフラストラクチャ要件:AIモデルが複雑になるほど、より多くの処理能力とインフラストラクチャ・サポートが必要になります。モデルの方法を選択する際には、トレーニングから稼働まで、モデルを実行する実用性を考慮する必要があります。モデルの種類によって、現実的に提供可能な以上のリソースが必要になる場合は、プロジェクト全体が破たんします。
オーバーフィッティング: AIモデルがトレーニング・データセットに過度にチューニングされると、その特有のデータセットに固定され、多様性や意外性に対応できなくなります。この現象は「オーバーフィッティング」と呼ばれ、将来の正確な予測を妨げます。オーバーフィッティングの例としては、トレーニング・データセットでは99%の精度が得られるのに、実際のデータセットでは75%から85%の精度しか得られない場合があります。AIにおける知覚精度とは、システムが現在の機能に基づいてどの程度の精度でパフォーマンスを発揮しているように見えるかを示します。これは、ユーザーまたはステークホルダーが観察または経験した精度です。一方、AIにおける潜在的な精度とは、システムが最高の条件で最適なリソースを使用した場合に達成できる精度の最大レベルを指します。知覚精度と潜在的な精度の違いを理解することは、AIシステムのパフォーマンスを評価し、改善または将来の開発領域を特定する上で重要です。

「オーバーフィッティング」と「オーバートレーニング」という用語はしばしば同じ意味で使用されていますが、それぞれに個別の意味があります。オーバーフィッティングとは、前述の説明の通り、AIがトレーニング・データでは非常に優れたパフォーマンスを発揮するものの、新しいデータでは適切に機能しないことを指します。オーバートレーニングとは、モデルを過度にトレーニングした結果、トレーニング・データと新しいデータの両方でパフォーマンスが低下することです��オーバートレーニングは、モデルのトレーニング時間が長すぎたり、モデルが複雑すぎて一般化しにくい場合に発生することがあります。モデルのトレーニング・プロセスでは、この2つの問題を回避する必要があります。
説明可能性: AIモデルにおける未解決の問題の1つは、意思決定方法に関する説明可能性の欠如です。ユーザーが出力に基づいく推論を行うことは可能でも、モデルの理由は不明瞭な状態のままになる場合があります。一部の開発者は、より透明性の高い説明可能性を持つように構築されたモデルなど、このギャップを埋めるためのツールを作成しています。しかし、導入、使いやすさ、詳細、アクセシビティは、入力と出力の両方ですべて異なります。

AIモデル・トレーニングの未来

AIはコンピューティングの黎明期から何らかの形で存在していましたが、アルゴリズム、CPUパワー、グラフィック・プロセッシング・ユニット（GPU）の処理能力、そしてクラウドベースのリソース共有の高度な進歩により、この20年間で著しい進歩を遂げました。AIは非常に多くのアプリケーションに組み込まれているため、多くのユーザーは無意識のうちにAIを利用しています。音楽をストリーミングすると、AIがお気に入りの曲やアーティストを分析してカスタマイズされたプレイリストが表示されます。テキスト・メッセージングを入力すると、AIがあなたがよく使用している単語に基づいて予測候補を提示します。自動おすすめ機能により新しく好きなテレビ番組を見つけたら、それはAIの功績です。

これがAIの現在ですが、この先には何があるのでしょうか。

AIの可能性は、モデルをトレーニングする機能の進化にかかっています。AIモデルのトレーニングにおける将来の可能性を見てみましょう。

AIモデルのトレーニング技術における進歩

AIのイノベーションが飛躍的に発展しているように感じられる場合、それには十分な理由があります。過去10年間におけるデータと接続性の爆発的な向上により、AIシステムのトレーニングが非常に容易になり、複雑なモデルを実現できるようになりました。また、新しいアルゴリズムの改善も成功を後押ししています。このため、AIが状況の背後にある方法と理由を理解する機能を獲得することによる深層推論、より少ないデータセットを使用しているトレーニング効率の向上、教師なし学習から成長するより効率的で正確なモデルなど、多くの高い目標が今後10年以内に実現可能であると考えられます。

転送学習の可能性

人にとって、伝達可能なスキルは新しい仕事に取り掛かることを容易にするため、雇用される能力と生産性を向上させます。AIにおける転移学習も同様です。しかし、効果的な転移学習にはまだ多くの課題があります。現在のところ、転移学習は、元のモデルと似通った領域で最適に機能するため、その使用は制限されています。転移学習の機能を拡張するには、より複雑な再トレーニングをサポートするために、処理能力とリソースを大幅に増やすことが必要になります。効率と処理の革新がなければ、最初からモデルを構築する方が簡単な場合もあります。

AIモデルのトレーニングにおける人間の監視の役割

おそらくAIによる最も強力な特徴は、人間よりも速く正確にタスクを実行し、出荷事務員や会計士などを反復的な作業から解放する機能でしょう。もちろん、そこまで到達するには、データセットをキュレーションし、出力を観察し、モデルを微調整する時間と労力が必要です。

適切なAIモデル・トレーニング・ツールの選び方

さまざまなAIモデル・トレーニング・ツールは、開発とトレーニングのプロセスを加速します。これらのツールには、デフォルトのモデル・ライブラリ、オープンソース・フレームワーク、コーディングと環境の支援、勾配ブースティングなどがあります。使用するモデルの種類に依存するものもあれば、特定の基準のコンピュート・リソースを必要とするものもあります。

どのツールがプロジェクトに最適かを判断するために、以下の質問に対する回答をまとめます。

AIモデルからどのような結果を得ることを望みますか。
元となるコンピュート・リソースは何ですか。
プロジェクトの範囲と予算は、それぞれどの程度ですか。
現在、開発プロセスのどの段階にいますか。
チームのスキルとは何ですか。
業界やプロジェクトにおけるガバナンスやコンプライアンスの制限はありますか。
プロジェクトで最も支援が必要な分野は何ですか。

これらへの回答は、AIモデル・トレーニング・プロセスを支援する効果的なツールを絞り込むうえで役立ちます。

OCIによるモデルトレーニングと並列アプリケーションのサポート

複雑なAIモデルをトレーニングするには、数百、場合によっては数千の独立したサービスが連携して情報を共有する必要があるため、リソース集約的な取り組みになる可能性があります。Oracle Cloud Infrastructure(OCI)は、高パフォーマンスのイーサネット・ネットワークを介して連携するGPUを提供し、可用性と安定性を最大限に高めながら顧客の時間とコストを削減します。OCIを使用することで、お客様はシンプルで高速な相互接続を手に入れ、非常に複雑なモデルのトレーニングと導入を大規模にサポートできます。

AIの前身である機械学習は、強力な計算による徹底的なルールと確率に基づいて構築されました。スーパーコンピューターのDeep Blueは、そのようにして世界クラスのチェストーナメントに出場しました。しかし、AIは外部データを活用したルールにとどまらない進化を遂げ、現在ではAIモデルは大量のデータセットによるトレーニングによって内部的なインサイトを生成することに重点を置いています。AIモデルの中にはまだルールベースの意思決定木を使用しているものもありますが、ニューラル・ネットワークにより複雑なプロセスや予測をサポートしているものもあります。

AIの進歩は素晴らしいものではありますが、このテクノロジーの未来は高品質なトレーニングにかかっています。

AIのユースケース（eBook）

どのようなレベルであれ、モデル・トレーニングを実施する企業は、関連するデータセットと組織のナレッジが十分にドキュメントにまとめられるよう徹底することを望みます。これを実現する優れた方法の1つが、トレーニング・サポート以外にも多くのメリットをもたらすAIセンター・オブ・エクセレンスです。

eBookを読む

AIモデルのトレーニングに関するFAQ

AIモデルのトレーニングについて教えてください。

AIモデルのトレーニングとは、AIモデルにキュレーションされたデータセットを提供し、その出力の精度を向上させるプロセスです。AIモデルの複雑さ、トレーニング・データセットの品質、トレーニング・データの量によって、このプロセスは長期化することがあります。トレーニング・プロセスが期待される成功のベンチマークに達すると、データ・サイエンティストは結果を引き続きモニターします。精度が低下したり、モデルが特定の状況に対応しにくくなったりした場合、モデルのさらなるトレーニングが必要となることがあります。

AIモデルはどこでトレーニングできますか。

適切なツールにアクセスできれば誰でも、必要なデータにアクセスできる限り、どのPCを使用してもAIモデルをトレーニングすることができます。そのステップとして、問題の特定、トレーニング・モデルの選択、トレーニング・データセットの検索、トレーニング・プロセスの実行などがあります。これは、プロジェクトの範囲と利用可能なリソースによって、小規模なローカル規模から大規模なエンタープライズ規模までさまざまな場合があります。新しい開発者や独立した開発者は、さまざまなプログラミング言語にわたってCPUリソースを提供し、地理的な問題を排除するクラウド・サービスを活用することができます。

AIモデルのトレーニング・コストの程度を教えてください。

AIモデルのトレーニング・コストは、プロジェクトの範囲によって異なります。業界全体で、CPU/GPUのパワーとクラウド・アクセスがより多くのリソースを提供するようになり、コストは低下傾向を続けています。実際、Stanford’s Institute for Human-Centered Artificial Intelligence AI Indexによると、画像分類などの小規模プロジェクトに対する平均トレーニング・コストは、2017年には1,000ドルでしたが、2022年にはわずか5ドルでした。

これに対し、大企業のAIプロジェクトのコストは実際に増加しています。たとえば、ChatGPTのトレーニングなどは、300万ドルから500万ドルの見積予算が必要になることもあります。この格差は、プロジェクトの複雑さと、リソースの増加によって、資金面で可能であれば、ますます複雑で限界を押し広げるようなプロジェクトが可能になっているという事実に起因しています。

AIモデリングの学習方法を教えてください。

AIモデルのトレーニング方法を学ぶには、正式な教育かOJTが必要となります。専門知識を習得したら、AIモデルの作成に関わる4つのステップから開始します。

問題の特定:ビジネス、学術、個人的なプロジェクトのいずれであっても、どのようなAIモデルも、解決したい問題を理解することから始まります。これにより、プロジェクトの実質的な方向性が示され、スコープ、予算、リソースの必要性など、さまざまな重要な要素が特定されます。
トレーニング・データのキュレーション:AIモデルは、学習するためのデータがあって初めて機能します。つまり、トレーニング・データセットを高品質ソースからキュレーションし、アルゴリズムで使用するために準備（クリーニング/変換）する必要があります。
モデルの開発:開発者は、必要な出力のタイプと使用可能なデータのタイプに応じて、AIモデルのAI型を複数から選択することができます。これが確立されると、トレーニング・プロセスが開始されます。モデルがトレーニング・データで高い精度を達成すると、開発チームは実際のデータに移行してパフォーマンスをテストすることができます。
導入:実際の結果を確認したら、モデルを稼働させます。この段階で開発者は、さらに改善する必要がある異常がないか、結果をモニターし続ける必要があります。AIモデルは、絶えず進化し続ける継続的なプロジェクトとして扱う必要があります。

AIモデルの4つのタイプを教えてください。

一般的に、AIモデルには次の4つのタイプがあります。

教師あり学習は、確立されたトレーニング・データセットと定義されたパラメータを使用してモデルをトレーニングします。
教師なし学習は、AIシステムがパラメータや目標なしにラベル付きではないデータセットを取り込み、データのパターンを判断します。
強化学習モデルは、まず実験的に意思決定を行い、それがポジティブまたはネガティブな強化につながります。時間の経過とともに、AIは「最善策」を学習します。
生成学習は、大量のサンプル・データを使用してプロンプト出力を作成する教師なしAI方法です。

データ・サイエンティス��によっては、既存のAIモデルを新しいモデルの出発点とする転移学習や、教師あり学習と教師なし学習を融合させた半教師あり学習も使用します