🚀on-demand-cluster
- プラグイン
- zilliz
- ソース
- GitHub で見る ↗
説明
次のような場合に使用: ユーザーがオンデマンド(Vector Lake / VectorLake)クラスターの作成、一覧表示、詳細確認、または削除を行いたい場合。 オンデマンドクラスターは、アイドル状態が一定のTTL(有効期間)を超えると自動的にサスペンドされ、Vector Lakeに対するアドホックなクエリワークロードを想定して設計されています。
原文を表示
Use when the user wants to create, list, describe, or delete an on-demand (Vector Lake / VectorLake) cluster. On-demand clusters auto-suspend after an idle TTL and are intended for ad-hoc query workloads against a Vector Lake.
ユースケース
- ✓オンデマンドクラスターを作成したい
- ✓オンデマンドクラスターの一覧を表示したい
- ✓オンデマンドクラスターの詳細を確認したい
- ✓オンデマンドクラスターを削除したい
本文(日本語訳)
前提条件
- CLIがインストールされ、ログイン済みであること(セットアップ スキルを参照)。
- 対象のプロジェクト/リージョンにVector Lakeインスタンスが存在すること(clusterスキル --
cluster create-vectorlakeを参照)。
コマンドリファレンス
オンデマンド クラスターの作成
create コマンドは手動実装であり、JSONモデルから自動生成されたものではありません。
POST /v2/clusters/createOnDemandCluster を呼び出し、以下のオプションを受け付けます:
zilliz on-demand-cluster create \
--project-id <project-id> \
--region-id <region-id> \
--cu-size <integer> # 必須。8以上の整数
--cluster-name <string> \ # 必須。最大64文字。英数字・スペース・_・-・CJK文字が使用可能
[--session-ttl <duration>] \ # アイドル自動サスペンドTTL: 30m, 1h, 90s など(最小60s、デフォルト60s)
[--max-query-node-cu <n>] \
[--max-query-node-replicas <n>]
Session TTLは、アイドル状態のオンデマンド クラスターが自動サスペンドされるまでの稼働継続時間を制御します。
フォーマットは <数値><s|m|h> で、最小値は60秒です。
サスペンド済みのオンデマンド クラスターは、次のクエリ実行時に透過的に自動再開されます。
使用例:
# デフォルトの60秒アイドルTTLで8-CUのオンデマンド クラスターを作成する
zilliz on-demand-cluster create \
--project-id proj-xxxx \
--region-id aws-us-east-1 \
--cu-size 8 \
--cluster-name "qc-prod-1"
# クエリ間のアイドル維持時間を30分に設定し、クエリノードのCU数とレプリカ数に上限を設ける
zilliz on-demand-cluster create \
--project-id proj-xxxx \
--region-id aws-us-east-1 \
--cu-size 16 \
--cluster-name "qc-batch-1" \
--session-ttl 30m \
--max-query-node-cu 16 \
--max-query-node-replicas 4
オンデマンド クラスターの一覧表示
zilliz on-demand-cluster list --project-id <project-id> --region-id <cloud-region>
オンデマンド クラスターの詳細表示
zilliz on-demand-cluster describe --cluster-id <on-demand-cluster-id>
オンデマンド クラスターの削除
zilliz on-demand-cluster delete --cluster-id <on-demand-cluster-id-to-delete>
利用ガイダンス
- オンデマンド クラスターはVector Lakeインスタンスに属し、
<projectId>と<regionId>の組み合わせの中にのみ存在します。listおよびdescribeのいずれも結果を返さない場合は、まず対象プロジェクトにVector Lakeが存在するかを確認してください(zilliz cluster create-vectorlake)。 listコマンドには--project-idと--region-idの両方が必須です。全プロジェクトを横断した一覧表示には対応していません。- ステータスは
CREATING→RUNNING→SUSPENDING→SUSPENDEDと遷移し、次のクエリ実行時にRESUMING→RUNNINGへ戻ります。SUSPENDING/SUSPENDEDは正常なアイドル状態であり、エラーではありません。 --session-ttlはアイドル自動サスペンドのタイマーです。最小値は60sであり、それより小さい値はAPIコール前にクライアント側で拒否されます。現在のデフォルトは60sのため、オンデマンド クラスターは積極的にサスペンドされます。インタラクティブなワークロードを実行する場合は、値を大きくすること(例:30m)を推奨します。--cu-sizeは8以上の値が必須であり、--cluster-nameは最大64文字で、英数字・スペース・_・-・漢字(CJK文字)が使用できます。deleteは不可逆かつ非同期の操作です。実行前に必ずユーザーへの確認を行ってください。クラスターの行はDELETING状態に移行し、クリーンアップ完了後に一覧から削除されます。- これらのコマンドは通常の
clusterスキルとは別物です。通常のクラスターは専有のコンピュートリソースを持つのに対し、オンデマンド クラスターは親のVector Lakeとストレージを共有します。zilliz on-demand-cluster deleteとzilliz cluster deleteを混同しないよう注意してください。
原文(English)を表示
Prerequisites
- CLI installed and logged in (see setup skill).
- A Vector Lake instance in the target project/region (see cluster
skill --
cluster create-vectorlake).
Commands Reference
Create an On-Demand Cluster
create is hand-written and not generated from the JSON model. It calls
POST /v2/clusters/createOnDemandCluster and accepts:
zilliz on-demand-cluster create \
--project-id <project-id> \
--region-id <region-id> \
--cu-size <integer> # required, >= 8
--cluster-name <string> \ # required, max 64 chars, letters/digits/space/_/-/CJK
[--session-ttl <duration>] \ # auto-suspend TTL: 30m, 1h, 90s (min 60s, default 60s)
[--max-query-node-cu <n>] \
[--max-query-node-replicas <n>]
Session TTL controls how long an idle on-demand cluster stays running before
it is automatically suspended. Format is <number><s|m|h>, with a floor of
60 seconds. Resuming a suspended on-demand cluster happens transparently on
the next query.
Examples:
# Create an 8-CU on-demand cluster with the default 60s idle TTL
zilliz on-demand-cluster create \
--project-id proj-xxxx \
--region-id aws-us-east-1 \
--cu-size 8 \
--cluster-name "qc-prod-1"
# Keep alive 30 minutes between queries, cap query node CU and replicas
zilliz on-demand-cluster create \
--project-id proj-xxxx \
--region-id aws-us-east-1 \
--cu-size 16 \
--cluster-name "qc-batch-1" \
--session-ttl 30m \
--max-query-node-cu 16 \
--max-query-node-replicas 4
List On Demand Clusters
zilliz on-demand-cluster list --project-id <project-id> --region-id <cloud-region>
Describe an On Demand Cluster
zilliz on-demand-cluster describe --cluster-id <on-demand-cluster-id>
Delete an On Demand Cluster
zilliz on-demand-cluster delete --cluster-id <on-demand-cluster-id-to-delete>
Guidance
- On-demand clusters belong to a Vector Lake instance and only exist inside a
<projectId>+<regionId>pair. If neitherlistnordescribereturns anything, first confirm that the project has a Vector Lake (zilliz cluster create-vectorlake). listrequires both--project-idand--region-id-- there is no all-projects listing.- Status flows through
CREATING->RUNNING->SUSPENDING->SUSPENDEDand back toRESUMING->RUNNINGon the next query. TreatSUSPENDING/SUSPENDEDas healthy idle state, not an error. --session-ttlis the idle auto-suspend timer. The minimum is60s; values smaller than that are rejected client-side before the API call. The current default is60s, so on-demand clusters are aggressive about suspending -- raise it (e.g.30m) when running interactive workloads.--cu-sizemust be >= 8 and--cluster-nameis at most 64 characters, allowing letters, digits, space,_,-, and Chinese characters.deleteis irreversible and asynchronous -- always confirm with the user before invoking. The cluster row moves toDELETINGand disappears once cleanup finishes.- These commands are distinct from the regular
clusterskill: a regular cluster owns its own compute, while on-demand clusters share storage with their parent Vector Lake. Do not confusezilliz on-demand-cluster deletewithzilliz cluster delete.
原文・著作権は Anthropic および各プラグイン作者に帰属します。日本語訳は Claude API による自動翻訳です。