🔧oracle-ai-data-platform-workbench-engineer-agent
- 作者
- Oracle
- ソース種別
- git-subdir
- ソース
- GitHub で見る ↗
説明
Oracle AI Data Platform(AIDP)Workbench エンジニア Agent(Claude Code 向け)—— Spark/Delta レイクハウスをフルサポートする 37 スキル構成の Agentです。 自然言語でプラットフォーム全体を操作できます。 **主な機能:** - カタログを探索してグラウンディングキャッシュを構築し、平易な英語表現を正確な Spark SQL へ変換 - データライフサイクル全体を実行(CREATE / INSERT / UPDATE / DELETE / MERGE、OPTIMIZE / VACUUM、タイムトラベル) - ファイルのインジェスト、データプロファイリング、品質ルールの設定 - パイプラインの作成・修復、クラスターのプロビジョニング、Spark UI を通じたデバッグ - プラットフォームのガバナンス管理(ロール、クレデンシャルストア、Delta Sharing、監査ログ) - ネイティブ Git 連携、バンドル管理、MLOps / MLflow サポート 公式 Oracle `aidp` CLI 経由で動作します。
原文を表示
Oracle AI Data Platform (AIDP) Workbench engineer agent for Claude Code — a 37-skill agent that operates the full Spark/Delta lakehouse in natural language. Discovers your catalog into a grounding cache, turns plain English into accurate Spark SQL, and runs the lifecycle (CREATE/INSERT/UPDATE/DELETE/MERGE, OPTIMIZE/VACUUM, time-travel). Ingests files, profiles data and sets quality rules, authors and repairs pipelines, provisions clusters, and debugs via the Spark UI. Governs the platform (roles, credential store, Delta Sharing, audit logs), plus native Git, bundles, and MLOps/MLflow. Runs via the official Oracle aidp CLI.
ユースケース
- ✓自然言語でデータベース操作を実行するとき
- ✓Spark SQLクエリを生成・実行するとき
- ✓データの品質確認やプロファイリングを行うとき
- ✓パイプラインの作成・修復を行うとき
- ✓ガバナンス管理やアクセス制御を設定するとき
同梱スキル(37)
🔄aidp-agent-flows
AIDPエージェントフローの検出、作成、デプロイ、および実行を行います。 次のような場合に使用: - エージェントフローの一覧表示・内容確認 - フローの作成・更新・デプロイ・実行 - セッションやガードレールの管理 - コンピュートリソースのアタッチ - リモートMCPサーバーのフローへのアタッチ(`MCP_TOOL`ノードを使用 — AIDPの「ネイテ…
🐍aidp-agent-highcode
aidputils と LangGraph を使用して、高コード Python で AIDP エージェントを構築します (低コードのエージェントフローキャンバスに対する、コードファーストの代替手段です)。 次のような場合に使用: - Python でエージェントを記述したい - LangGraph / `create_react_agent` / `Sta…
🗄️aidp-ai-sql
Spark SQL内で`ai_generate()`を使用してAIDP上のLLM関数を実行します。 次のような場合に使用: - SQLの中で直接LLMを使って行の要約・分類・抽出・エンリッチメントを行いたい場合 - 集計結果に基づいてナラティブ(説明文)を生成したい場合 - レイクハウス上でRAGスタイルのグラウンデッド分析を行いたい場合 シグネチャはモデ…
📊aidp-analyzing-data
Spark SQL を使用して AIDP レイクハウス上のビジネスに関する質問に回答します。 次のような場合に使用: ユーザーがデータに関する質問(「件数は?」「上位N件は?」「見せて」「推移は?」「売上の内訳は?」など)をしたとき、またはアドホックな Spark SQL を実行したいとき。 `.aidp/catalog.md` および `.aidp/se…
📋aidp-audit
AIDPの監査ログを管理・検索します。DataLakeの監査の有効化/無効化、保持期間の設定、および監査ログエントリのクエリを行います。 次のような場合に使用: - ユーザーが監査ログについて質問している - 誰が何を行ったかを確認したい - AIDPアクティビティのコンプライアンス対応や保持ポリシーに関する要件がある - 監査イベントを検索したい 自己完…
📦aidp-bundle
AIDPリソースをバンドルとしてデプロイします — バンドルの作成、すべてのアセットのアトミックなデプロイ、デプロイステータスの照会、およびパージを行います。 次のような場合に使用: - AIDPリソースのセットをまとめてプロモート/デプロイしたい場合 - デプロイメントバンドルを管理したい場合 - バンドルのデプロイステータスを確認したい場合 - バンド…
📚aidp-catalog-explore
AIDPデータカタログをリアルタイムで参照します。カタログ・スキーマ・テーブル・ボリュームの一覧取得、テーブルのカラムやプロパティの確認、および人間が読める名前からカタログキーへの解決が可能です。 次のような場合に使用: - 「どんなカタログ/スキーマ/テーブルがあるか」と聞かれたとき - 「テーブルXの詳細を教えて」と聞かれたとき - 「Yのカラム構成は…
📚aidp-catalog-init
一度だけ実行するAIDPカタログ探索機能です。テーブル、カラム、FK/結合ヒント、値ディクショナリといった情報を含む、キャッシュ済みかつバージョン管理可能な `.aidp/catalog.md` グラウンディングファイルを生成・書き込みます。 次のような場合に使用: - ユーザーが `/aidp-catalog-init` と入力したとき - 「レイクハウ…
🖥️aidp-cluster-ops
AIDP Spark コンピュートクラスターを管理します — クラスターの一覧表示、ステータス確認、起動/停止/再起動、インストール済みライブラリの管理(JAR/Python)、新規クラスターのプロビジョニング/スケーリング(ドライバー/ワーカーシェイプ、オートスケール、GPU/RAPIDS、AI Compute)、および外部 BI ツールの接続(JDBC…
🔐aidp-credentials
AIDPクレデンシャルストア(シークレット)を管理します。 AIDPワークフローで使用するクレデンシャルの一覧取得・取得・作成・更新・削除が可能です。 次のような場合に使用: - シークレットをハードコーディングする代わりに、一元管理・ローテーションしたい場合 - 接続クレデンシャルを管理したい場合 メインのエンジンは公式の `aidp` CLI(`aid…
✅aidp-data-quality
AIDPテーブルに対してデータ品質ルールのチェックを実行します。 チェック対象のルールは以下の通りです: - NOT NULL制約 - 一意性(ユニーク制約) - 許容範囲・許容値セット - 参照整合性 - データの鮮度(フレッシュネス) 次のような場合に使用: ユーザーがデータのバリデーションを行いたい場合、NULLや重複・孤立レコードを検出したい場合、…
🔗aidp-data-sharing
Delta Sharingを通じてAIDPデータを共有します — 共有の作成・管理、データアセットの追加、受信者の管理、アクセス権限の付与を行います。 次のような場合に使用: - テーブルまたはスキーマを別のチームや組織と共有したい - Delta Sharingをセットアップしたい - 受信者を管理したい - 共有の権限やトークンの有効期限を制御したい …
🔧aidp-engineer-bootstrap
AIDP プラグイン(自己完結型)の初回セットアップを行います。 以下の処理を順に実行します: - `oci` CLI および `DEFAULT` プロファイルの `api_key` を検証 - バンドルされた Python 依存パッケージをインストール - リージョン・DataLake の OCID・ワークスペースを自動検出 - 両エンジンのスモークテス…
🛣️aidp-engineer-overview
Oracle AI Data Platform(AIDP)のデータエンジニアリング作業向けのルーターおよびセットアップ/認証トラブルシューティング機能です。 次のような場合に使用: - ユーザーがAIDPについて言及しており、どのskillを使えばよいかわからない場合 - 「AIDPで何ができますか」と質問している場合 - 実現したい機能をもとにタスクを説…
🔗aidp-federate
1つのAIDP Sparkセッション内で複数のデータソースにわたるフェデレーションを実行します。複数のコネクター(Oracle ADB/ExaCS、Fusion、Snowflake、S3、レイクハウステーブルなど)からデータを読み込み、単一のノートブック上でそれらを結合することができます。 次のような場合に使用: ユーザーが複数のソースからデータを組み合わ…
🌿aidp-git
ワークスペース内のGitリポジトリに対して、ネイティブGitをAIDPワークスペース上で操作します。 対応機能: ブランチ管理、チェックアウト、コミット/プッシュ、プル、マージ、リベース、リセット、差分表示、コンフリクト解消。 次のような場合に使用: - ワークスペース上のノートブックやコードをGitでバージョン管理したい - ブランチの作成・切り替えを行…
📥aidp-ingest-file-to-table
データファイル(CSV / JSON / Parquet など)を管理対象の AIDP Delta テーブルに読み込みます。 次のような場合に使用: ファイルをテーブルに取り込みたい、ファイルからテーブルを作成したい、またはレイクハウスにローデータを格納したい場合。 1ステップのパスと、アップロード → スキーマ推論 → 作成の3ステップパスの両方をサポー…
📚aidp-knowledge-bases
RAG のための AIDP ナレッジベースを構築・管理します — カタログデータ上に KB を作成し、埋め込みモデルとチャンキング方式を選択、HNSW/IVF ベクトルインデックスを構築、データソース(ボリューム/テーブル)を追加、インジェスチョンジョブを実行、および KB のパーミッションを管理します。 次のような場合に使用: ユーザーが RAG、ナレッ…
🚀aidp-migration
別のプラットフォーム(Databricks など)から AIDP へのノートブック/ジョブの移行をガイドします。 次のような場合に使用: - Databricks のノートブック/ジョブを AIDP に移植したい場合 - ワークロードを AIDP レイクハウスに移行したい場合 - 移行計画を立てたい場合 オーケストレーション専用 — 他の自己完結型 `ai…
📊aidp-mlops
AIDP の MLflow 互換 MLOps において、実験・実行・メトリクス/パラメータ・登録済みモデル・モデルバージョンを追跡・管理します。 次のような場合に使用: - 実験のログ記録・追跡を行いたい - 実行やメトリクスの一覧を取得したい - モデルを登録したい - モデルバージョンのステージを遷移させたい - モデルレジストリをクエリしたい 主要な…
📦aidp-models-catalog
AIDP DataLake で利用可能/インストール済みのモデルを一覧表示し、そのパラメータを確認するとともに、MLOps モデルレジストリを閲覧します。 次のような場合に使用: - ユーザーが「利用可能なモデルは何か」と尋ねているとき - `ai_generate()` や Agent フローで使用するモデル名が必要なとき - 特定モデルのパラメータを確…
📓aidp-notebooks
AIDPノートブックの作成・編集・実行、およびカーネルセッションの管理を行います。 次のような場合に使用: - ノートブックを新規作成または編集したい - クラスター上でセル/コードを実行したい - カーネルセッションのアタッチ/デタッチを行いたい - インタラクティブなノートブックを構築したい(例: ウィジェット + Spark SQL + Plotly…
📊aidp-observability
AIDP の運用状態を表示します — 最近アクセスしたリソースや、長時間実行中の非同期オペレーション(ステータス、完了状況、待機中)を確認できます。 次のような場合に使用: ユーザーが「最近何があったか」「何が実行中か」「あのオペレーションはもう完了したか」と尋ねたとき、または非同期の AIDP オペレーション(プロビジョニング、大規模コミットなど)を追跡…
🔄aidp-pipelines
次のような場合に使用: ユーザーがパイプラインを構築したい、Job を作成・更新・実行したい、定期的な実行をスケジュールしたい、実行のステータスを確認したい、タスクの出力を読み取りたい、または実行をキャンセルしたい場合。 AIDP Job(ノートブックや Python によるタスク DAG を cron でスケジュール実行する仕組み)の作成・スケジューリン…
📊aidp-profiling-tables
AIDPテーブルのプロファイリングを実行します。取得できる情報は以下の通りです: - 行数 - カラムごとのnull率(%) - ユニーク値の数 - 最小値 / 最大値 / 平均値 - 上位K件の値 次のような場合に使用: ユーザーがテーブルのプロファイリングを要求した場合、カラムの統計情報やデータ品質のスナップショットを必要としている場合、またはデータセ…
🔐aidp-roles-access
AIDPのロールとアクセスを管理します。具体的には、ロールの一覧表示、権限の確認、ロールの作成、メンバーの追加/削除、およびカタログ・スキーマ・テーブル・ビュー・ボリューム・ワークスペース・ワークスペースオブジェクト・クラスターに対するリソース単位の権限付与/取り消しに対応します。 また、列のマスキング/分類(制限付きビューとオントロジーによる機密性設定)…
📊aidp-semantic-model
AIDP のセマンティックグラウンディングレイヤー(`.aidp/semantic.md`)を管理します。 対象となる内容は、論理エンティティ名、SQL で定義されたメトリクス、カーディナリティを含むジョイン定義、シノニム(同義語)、および値ディクショナリです。 次のような場合に使用: - メトリクスやビジネス用語を定義したいとき - 自然言語から SQL…
🔍aidp-spark-debugging
AIDPのSparkジョブが遅延または失敗した場合の診断を、クラスターログ・メトリクス・Spark UI REST APIを使って行います。 次のような場合に使用: - ジョブ/クエリが遅い、または失敗している - ユーザーが「なぜ失敗したのか / なぜ遅いのか」を尋ねている - ステージ/タスクのタイミング、データスキュー、シャッフル/スピル、Execu…
⚡aidp-spark-optimization
次のような場合に使用: Sparkジョブ/ノートブックの実行が遅い、SLAを達成できていない、スピル(spill)が発生している、OOM(メモリ不足)が起きている、スモールファイルが大量に生成されている、またはシャッフルやデータスキューが著しい場合。 Spark/PySparkコードやSpark UIをパフォーマンス観点でレビューする場合。 大規模なSpa…
📝aidp-sql-ddl
AIDPレイクハウス上のSpark SQLによる書き込み系操作を担当します。 対象操作は以下の通りです: - **DDL**: テーブル・ビュー・スキーマの作成(CREATE)/変更(ALTER)/削除(DROP) - **DML**: INSERT / UPDATE / DELETE / MERGE によるアップサート - **Deltaメンテナンス**…
📋aidp-table-management
AIDPカタログオブジェクトのコントロールプレーンライフサイクル管理 — テーブル、ビュー、スキーマ、カタログの作成/更新/削除/リフレッシュ、 および外部カタログ/接続(ALH/ADW/オブジェクトストレージ)を 永続的なカタログオブジェクトとして登録します。 次のような場合に使用: - コントロールプレーン経由でテーブル/ビュー/スキーマ/カタログを作…
🔧aidp-tools
スタンドアロンの再利用可能なAIDPエージェントToolを作成・管理します。 対象となるToolの種類は、SQL、Prompt、RAG、HTTP、Custom、MCPツールで、 キーによって複数のエージェントフロー間で共有することができます。 次のような場合に使用: - 再利用可能なツールを定義したい場合(単一のフローにインラインで組み込むのではなく) -…
⚙️aidp-user-settings
AIDPユーザー設定/プリファレンスを管理します。DataLakeに関するユーザー設定の一覧取得・取得・作成・更新・削除を行います。 次のような場合に使用: ユーザーがAIDPワークベンチのプリファレンス/設定を確認・変更したい場合、またはユーザー設定エントリを管理したい場合。 自己完結型。公式の `aidp user-setting` CLIを優先的に使…
🔐aidp-verified-queries
再利用可能な「質問→Spark SQL」のペアを `.aidp/verified-queries.md` に登録・検証し、エージェントが新しいSQLを生成する前に信頼済みのSQLを再利用できるようにします。 次のような場合に使用: - 動作確認済みのクエリを正規クエリとして保存したい - 検証済みクエリのリポジトリを構築したい - 繰り返し発生する質問に対…
📦aidp-volumes
AIDP ボリュームを操作します — ボリュームの一覧表示、ボリューム内のファイル閲覧、PAR フローを介したアップロード/ダウンロード、およびディレクトリの作成を行います。 次のような場合に使用: ユーザーがボリュームについて言及している場合、大容量ファイルやバイナリファイルをステージングする必要がある場合、またはボリュームとの間でデータを移動する場合(…
🏗️aidp-workspace-admin
AIDP DataLake インスタンスおよびワークスペースのプロビジョニングと検査を行います。 顧客の VCN/サブネットに接続されたプライベートネットワークワークスペースにも対応しています。 次のような場合に使用: - ワークスペースまたは DataLake インスタンスの作成・一覧取得・詳細取得を行いたい場合 - 新規(例: プライベート)AIDP …
📁aidp-workspace-files
ファイルおよびノートブックをAIDPワークスペースのファイルシステム上で管理します。 ファイル・フォルダ・ノートブックの一覧表示、アップロード、ダウンロード、読み取り、作成、移動、名前変更、削除が可能です。 次のような場合に使用: ユーザーがスクリプト・ノートブック・設定ファイルをワークスペースに配置したいとき、ワークスペース内のファイルを読み取ったり移動…
原文・著作権は Anthropic および各プラグイン作者に帰属します。日本語訳は Claude API による自動翻訳です。