🤖sagemaker-ai
- ソース種別
- git-subdir
- ソース
- GitHub で見る ↗
説明
AIモデルの構築・トレーニング・デプロイを支援する、Amazon SageMaker AIの広範な機能領域をカバーした、深いAWS AI/MLの専門知識をコーディングアシスタントに直接提供するツールです。
原文を表示
Build, train, and deploy AI models with deep AWS AI/ML expertise brought directly into your coding assistants, covering the surface area of Amazon SageMaker AI.
ユースケース
- ✓AIモデルの構築を支援してもらうとき
- ✓モデルのトレーニングを実施するとき
- ✓AIモデルをデプロイするとき
- ✓AWS AI/MLの専門知識が必要なとき
同梱スキル(19)
📊dataset-evaluation
データセットのフォーマットと品質を、SageMakerのモデルファインチューニング(SFT、DPO、またはRLVR)向けに検証します。 次のような場合に使用: ユーザーが「データセットは問題ないか」「データを評価してほしい」「トレーニングデータを確認してほしい」「独自のデータを持っている」と言った場合、またはファインチューニングジョブを開始する前。 ファイ…
🔄dataset-transformation
モデルのトレーニングや評価のために、データセットをMLスキーマ間で変換するコードを生成します。 次のような場合に使用: ユーザーが「transform」「convert」「reformat」「change the format」と指示した場合、またはデータセットのスキーマをターゲットフォーマットに合わせて変更する必要がある場合。フォーマット変換の際は、イン…
📁directory-management
プロジェクトディレクトリのセットアップと成果物の整理を管理します。 次のような場合に使用: - 新規プロジェクトを開始するとき - 既存のプロジェクトを再開するとき - `PLAN.md` をプロジェクトディレクトリに関連付ける必要があるとき プロジェクトのフォルダ構造(`specs/`、`scripts/`、`notebooks/`、`manifests…
🎯finetuning
SageMakerのサーバーレストレーニングジョブを使用して、ベースモデルをファインチューニングするコードを生成します。 次のような場合に使用: ユーザーが「トレーニングを開始する」「モデルをファインチューニングしたい」「トレーニングの準備ができた」と言ったとき、またはプランがファインチューニングのステップに達したとき。 SFT、DPO、RLVR、RLAI…
🎯finetuning-technique
次のような場合に使用: ユーザーがファインチューニングを行うことを決定し、手法を選択する必要がある場合、 またはモデルに対して手法の検証が必要な場合。 ユーザーのユースケースに応じてファインチューニング手法(SFT、DPO、RLVR、または RLAIF)を選択し、 選択したモデルで利用可能なレシピに対して検証を行います。 事前に model-selecti…
🔧hyperpod-cluster-debugger
HyperPod(EKSまたはSlurm)クラスター全体の問題を診断し、修復します。 対象となる問題には以下が含まれます: クラスターの作成・デプロイ失敗(CloudFormation、EFAヘルスチェック、ライフサイクルスクリプト、キャパシティ)、EKSアクセス、ノード置換、CloudFormationネストスタックエラー、メンテナンス後のロールバック状…
🔧hyperpod-issue-report
HyperPodクラスター(EKSおよびSlurm)から診断ログと構成情報を収集し、トラブルシューティングおよびAWSサポートケース向けの包括的な障害レポートを生成します。 次のような場合に使用: - HyperPodクラスターノードから診断情報を収集する必要がある - AWSサポート向けの障害レポートを作成する必要がある - ノード障害やパフォーマンス問…
🔍hyperpod-nccl
HyperPod GPU クラスター(EKS または Slurm)上の NCCL 障害および関連するトレーニング Pod 障害を診断します。 対象となる障害の例: - トレーニングのハング - AllReduce / コレクティブ操作のタイムアウト - EFA または libfabric のエラー - ランデブー(rendezvous)失敗 - EFA T…
🔧hyperpod-node-debugger
HyperPodクラスター(EKSまたはSlurm)における特定ノードの問題を診断・修復します。 次のような場合に使用: 対象ノードが異常、無応答、停止状態にある、または交換が必要な場合。 カバーする範囲: - ノード上のEFA - GPU/アクセラレータハードウェア(XID、ECC、NVLink、row-remap、DCGM) - Slurmノードのdo…
🔍hyperpod-performance-debugger
Amazon SageMaker HyperPod クラスターのパフォーマンス問題を診断します。 対象は、ノード間の不均一な NCCL 帯域幅と低いファイルシステムスループットです。 読み取り専用。 ホスト側のシグナル(Xid、ECC、NVLink、EFA 到達可能性、FSx 飽和状態)を収集し、 問題の修復に適切な兄弟 Skill(hyperpod-no…
🔧hyperpod-slurm-debugger
Amazon SageMaker HyperPod Slurmクラスター上のSlurmスケジューラーおよびノードデーモンに関する問題を診断専用のSkill。 スコープはHyperPodトラブルシューティングガイドに準拠しています。 次のような場合に使用: - Slurmノードが `down` / `drain` 状態で固まっている - 自動修復(auto-…
🖥️hyperpod-ssm
AWS Systems Manager (SSM) を介した SageMaker HyperPod クラスターノードへのリモートコマンド実行およびファイル転送。 これは HyperPod ノードにアクセスするための主要なインターフェースであり、直接 SSH によるアクセスは利用できません。 次のような場合に使用: クラスターノードでのコマンド実行、ノードへ…
🔍hyperpod-version-checker
SageMaker HyperPod クラスターノード上のソフトウェアコンポーネントバージョンを確認・比較します。 対象コンポーネントは、NVIDIAドライバー、CUDAツールキット、cuDNN、NCCL、EFA、AWS OFI NCCL、GDRCopy、MPI、Neuron SDK(Trainium/Inferentia)、Python、PyTorchで…
🚀model-deployment
SageMaker Serverless Model Customizationでファインチューニングされたモデルを、SageMakerエンドポイントまたはBedrockにデプロイするコードを生成します。 次のような場合に使用: ユーザーが「モデルをデプロイしたい」「エンドポイントを作成したい」「利用可能な状態にしたい」と言った場合、またはデプロイオプショ…
📊model-evaluation
Pythonコードを生成して、SageMakerモデルの評価を実行します。 LLM-as-Judge(LLMを評価者として使用する方式)とCustom Scorer(カスタムスコアラー)の2種類の評価タイプをサポートしています。 次のような場合に使用: ユーザーが「モデルを評価して」「ベンチマークを実行して」「モデルのパフォーマンスをテストして」「モデルの…
🧠model-selection
SageMaker Hub に問い合わせて、ユーザーのユースケースに適したベースモデルを選択します。 次のような場合に使用: - どのモデルを使えばよいか尋ねている - ベースモデルを選択または変更したい - モデル名やモデルファミリーに言及している(例: 「Llama」「Mistral」「Nova」など) - ベースモデルを評価したい なお、モデル名が既…
📋planning
ユーザーの意図を把握し、モデルカスタマイズワークフローに向けた構造化されたステップバイステップのプランを生成します。 このスキルは、ユーザーのリクエストがモデルカスタマイズに関連する場合、**常に他のスキルと併せて有効化する必要があります**。対象となるのは、ファインチューニング、トレーニング、構築、カスタマイズ、データのレビュー、アプローチに関するアドバ…
🔧sdk-getting-started
SageMaker AI の操作に向けてユーザーの環境を検証します。 SDK バージョン、AWS リージョン、および実行ロールを確認します。 次のような場合に使用: ユーザーが「セットアップ」「使い始める」「環境を確認したい」「SDK を設定する」と述べたとき、 またはSageMaker / Bedrock のトレーニング、評価、デプロイメントを含む任意の…
📋use-case-specification
AWSの責任あるAIレンズが推奨する、モデルカスタマイズのためのビジネス上の問題、ステークホルダー、および測定可能な成功基準を定義した再利用可能なユースケース仕様ファイルを作成します。 次のような場合に使用: モデルカスタマイズ計画における最初のデフォルトステップとして使用します。ユーザーが明示的に拒否した場合、またはすでに再利用可能なユースケース仕様が存…
原文・著作権は Anthropic および各プラグイン作者に帰属します。日本語訳は Claude API による自動翻訳です。