🧱databricks
- 作者
- Databricks
- ソース種別
- git-subdir
- ソース
- GitHub で見る ↗
説明
Databricks の CLI、Apps、Lakebase、Model Serving、Lakeflow Jobs、Spark Declarative Pipelines、Declarative Automation Bundles (DABs)、およびクラシックからサーバーレスへの移行に対応したスキル集。
原文を表示
Databricks skills for the CLI, Apps, Lakebase, Model Serving, Lakeflow Jobs, Spark Declarative Pipelines, Declarative Automation Bundles (DABs), and classic-to-serverless migration.
同梱スキル(29)
🧩databricks-agent-bricks
エージェントブリックを作成します: ドキュメントの Q&A に対応するナレッジアシスタント (KA) と、マルチエージェントオーケストレーション (MAS) のためのスーパーバイザーエージェント。
🤖databricks-ai-functions
次のような場合に使用: DatabricksのビルトインAI関数(ai_classify、ai_extract、ai_summarize、ai_mask、ai_translate、ai_fix_grammar、ai_gen、ai_analyze_sentiment、ai_similarity、ai_parse_document、ai_query、ai_fo…
🐳databricks-ai-runtime
Databricks AI Runtime (`air`) CLI ワークロード用のカスタム Docker イメージを構築します。 次のような場合に使用: ユーザーが独自の Docker コンテナイメージを `air` ワークロードに持ち込む必要がある場合。具体的には、Databricks ベースイメージまたはスクラッチからの Dockerfile 作成、…
📊databricks-aibi-dashboards
Databricks AI/BI ダッシュボードを作成します。 Databricks ダッシュボードは固有の JSON 構造を持つため、Lakeview ダッシュボードの作成・更新・デプロイ時には必ずこのツールを使用してください。 **重要:** デプロイ前に、すべての SQL クエリを CLI 経由で必ずテストすること。 ガイドラインに厳密に従ってくださ…
🎨databricks-app-design
カスタムコードの Databricks Apps(AppKit/React)におけるデータ画面の UX を設計します。対象は KPI/概要ページ、レポート、チャート、テーブル、および Genie/チャット型データアシスタントで、具体的な AppKit コンポーネントにマッピングされます。 次のような場合に使用: データを表示したり、データに関する質問に回答…
🏗️databricks-apps
Databricks Appsプラットフォーム上でアプリを構築します。 次のような場合に使用: データアプリ、分析ツール、またはカスタムインタラクティブビジュアライゼーションの作成を求められた場合。 「ダッシュボードを作成して」というシンプルなリクエストは、マネージドAI/BI(Lakeview)ダッシュボードを意味するため、このSkillではなく `da…
🚀databricks-apps-python
Databricksアプリケーションを構築します。 新規アプリには AppKit(TypeScript + React SDK)を優先し、Pythonが必要な場合は Pythonフレームワーク(Dash、Streamlit、Gradio、Flask、FastAPI、Reflex)にフォールバックします。 OAuth認可、アプリリソース、SQLウェアハウスお…
🧱databricks-core
Databricks CLIの操作、および全てのDatabricksに関する作業の親スキル/エントリーポイントスキルです。 認証、プロファイルの選択、データ探索、バンドル、そしてGenieによる自然言語データQ&Aを担当します。 次のような場合に使用: Databricksに関する任意のタスク(CLI、認証、プロファイル、カタログ/テーブルの探索など)にお…
📦databricks-dabs
宣言型オートメーションバンドル(DABs、旧称: Databricks Asset Bundles)の作成・設定・検証・デプロイ・実行・管理を行います。 次のような場合に使用: ダッシュボード、ジョブ、パイプライン、アラート、ボリューム、アプリなど、DABs を通じて Databricks リソースを操作する場合。
🗄️databricks-dbsql
Databricks SQL(DBSQL)の高度な機能およびSQLウェアハウスの機能に関するSkill。 ユーザーが以下のいずれかに言及した場合、このSkillを**必ず**呼び出すこと: 「DBSQL」「Databricks SQL」「SQL warehouse」「SQLスクリプティング」「ストアドプロシージャ」「CALL procedure」「マテリア…
📚databricks-docs
Databricksのドキュメントを`llms.txt`インデックス経由で参照します。 次のような場合に使用: - 他のスキルでカバーされていないトピックを調べたいとき - 馴染みのないDatabricks機能を調べたいとき - API、設定、またはプラットフォーム機能に関する公式ドキュメントが必要なとき
🔧databricks-execution-compute
Databricks上でコードを実行し、コンピューティングリソースを管理します: サーバーレス、クラシック、またはインタラクティブクラスターを通じてPython / Scala / SQL / Rを実行し、クラスターおよびSQLウェアハウスの作成・サイズ変更・削除を行います。
🗄️databricks-iceberg
DatabricksにおけるApache Icebergテーブル — マネージドIcebergテーブル、External Iceberg Reads(旧称: Uniform)、互換モード、Iceberg RESTカタログ(IRC)、Iceberg v3、Snowflakeとの相互運用、PyIceberg、OSS Spark、外部エンジンアクセスおよびクレデ…
🏗️databricks-jobs
Databricksにおいて、DABs・Python SDK・CLIを通じてLakeflow Jobsを開発・デプロイします。 次のような場合に使用: ノートブック、Pythonホイール、SQL、dbt、またはパイプラインを使用したデータエンジニアリングジョブを作成する場合。 実装を開始する**前に**呼び出してください。
🗄️databricks-lakebase
Databricks Lakebase Postgres: プロジェクト、スケーリング、接続設定、Lakebase 同期テーブル、および Data API に関するスキル。 次のような場合に使用: Lakebase データベース、OLTP ストレージ、または Databricks 上の Postgres へのアプリ接続について質問された場合。
🔗databricks-lakeflow-connect
Lakeflow Connect を使用して、Databricks へのマネージド取り込みパイプラインを構築します。 次のような場合に使用: SaaS アプリ(Salesforce、Workday Reports、ServiceNow、Google Analytics 4、HubSpot、Confluence)またはデータベース(SQL Server のク…
📊databricks-metric-views
Unity Catalog メトリックビュー: YAML 形式でガバナンスされたビジネスメトリクスを定義・作成・クエリ・管理します。 次のような場合に使用: 標準化された KPI、収益メトリクス、注文分析、またはチームやツールを横断して一貫した定義が必要な再利用可能なビジネスメトリクスを構築する場合。
🤖databricks-ml-training
MLflowトラッキングおよびUnity Catalogへの登録を使用して、DatabricksでMLまたはカスタムAgentモデルをトレーニングします。 次のような場合に使用: - Optunaチューニングを用いた分類・回帰またはディープラーニングモデル(XGBoost、scikit-learn、LightGBM、PyTorchなど)のトレーニング - …
🔬databricks-mlflow-evaluation
MLflow 3 GenAI エージェント評価。 次のような場合に使用: - `mlflow.genai.evaluate()` のコードを記述する - `@scorer` 関数を作成する - 組み込みスコアラー(Guidelines、Correctness、Safety、RetrievalGroundedness)を使用する - トレースから評価データセ…
🚀databricks-model-serving
Databricks Model Serving エンドポイントのライフサイクル管理および運用。 次のような場合に使用: - Serving エンドポイントの CRUD 操作(CLI または MLflow Deployments クライアント経由) - A/B テスト / カナリアデプロイ向けのトラフィックルーティング設定、およびゼロダウンタイムでのバージ…
🔄databricks-pipelines
Databricks 上で Lakeflow Spark Declarative Pipelines(旧称: Delta Live Tables)を開発します。 次のような場合に使用: Python または SQL を使用してバッチまたはストリーミングのデータパイプラインを構築する場合。 実装を開始する前に呼び出してください。
🔌databricks-python-sdk
Databricks開発に関するガイダンスを提供します。Python SDK、Databricks Connect、CLI、REST API を網羅しています。 次のような場合に使用: `databricks-sdk`、`databricks-connect`、または Databricks API を使用した開発作業を行う際。
🚀databricks-serverless-migration
クラシックコンピュートからサーバーレスコンピュートへ、Databricksワークロードを移行します。 次のような場合に使用: - ノートブック、ジョブ、パイプライン、またはScala JAR(`spark_jar_task`)をクラシッククラスターからサーバーレスへ移行する場合 - 既存コードがサーバーレスに対応しているか確認する場合 - サーバーレス対応…
🌊databricks-spark-structured-streaming
Spark Structured Streamingの本番ワークロード向け総合ガイドです。 次のような場合に使用: - ストリーミングパイプラインの構築 - Kafkaインジェストの実装 - リアルタイムモード(RTM)の導入 - トリガーの設定(`processingTime`、`availableNow`) - ウォーターマークを用いたステートフル操作…
🔄databricks-synthetic-data-gen
Spark + Faker を使用してリアルな合成データを生成します(強く推奨)。 サーバーレス実行に対応し、複数の出力フォーマット(Parquet / JSON / CSV / Delta)をサポート。 数千行から数百万行規模まで柔軟にスケールします。 小規模データセット(1万行未満)の場合は、ローカルで生成してボリュームにアップロードすることも可能です…
📊databricks-unity-catalog
Unity Catalog のシステムテーブルおよびボリューム。 次のような場合に使用: - システムテーブル(監査、リネージ、課金)へのクエリ実行 - ボリュームのファイル操作(`/Volumes/` へのアップロード、ダウンロード、ファイル一覧の取得)
📄databricks-unstructured-pdf-generation
Databricks上でRAG/非構造化ドキュメント評価データセットおよびデモ用ドキュメント(Knowledge Assistant向けなど)を構築します。 具体的には、合成PDFをローカルで生成し、Unity Catalogボリュームにアップロードしたうえで、検索評価用のテスト質問を各ドキュメントと対応付けます。 次のような場合に使用: - RAGパイプ…
🔍databricks-vector-search
Databricks Vector Search のエンドポイントおよびインデックスを、RAG(検索拡張生成)とセマンティック検索に活用するためのスキルです。 以下の内容をカバーします: - インデックスの種類 - 検索モード - エンドツーエンドの RAG パターン
📊databricks-zerobus-ingest
gRPC を使用して Databricks Delta テーブルへのニアリアルタイムデータ取り込みを行う、Zerobus Ingest クライアントを構築します。 次のような場合に使用: - メッセージバスを介さず Unity Catalog テーブルに直接書き込むプロデューサーを作成する場合 - Python / Java / Go / TypeScri…
原文・著作権は Anthropic および各プラグイン作者に帰属します。日本語訳は Claude API による自動翻訳です。