📥import
- プラグイン
- zilliz
- ソース
- GitHub で見る ↗
説明
次のような場合に使用: ユーザーが Zilliz Cloud のインポートジョブを通じて Milvus コレクションへのデータ一括インポートを行いたい場合、またはインポートステージ(インポートジョブが参照する事前アップロード済みファイルのホルダー)を管理したい場合。
原文を表示
Use when the user wants to import bulk data into a Milvus collection via Zilliz Cloud import jobs, or manage import stages (pre-uploaded file holders that import jobs reference).
ユースケース
- ✓Milvus コレクションへデータを一括インポートするとき
- ✓インポートジョブを通じてデータを管理したいとき
- ✓インポートステージを管理したいとき
- ✓事前アップロード済みファイルを扱うとき
本文(日本語訳)
前提条件
- CLIがインストール済みでログイン済みであること(セットアップ スキルを参照)。
- 対象のコレクションが、ターゲットクラスター上に存在していること。
コマンドリファレンス
インポートジョブ
インポートジョブの開始
zilliz import start --collection <ターゲットコレクション名>
# オプション:
# --cluster-id <ターゲットクラスターID>
# --project-id <プロジェクトID>
# --region-id <リージョンID>
# または生のJSONで指定: --body '{"files": [["s3://bucket/path/data.parquet"]]}'
インポート一覧の取得
zilliz import list
# オプション:
# --cluster-id <クラスターID>
# --project-id <プロジェクトID>
# --region-id <リージョンID>
# --database <データベース名>
インポートステータスの確認
zilliz import status --job-id <インポートジョブID>
# オプション:
# --cluster-id <クラスターID>
# --project-id <プロジェクトID>
# --region-id <リージョンID>
インポートステージ
ステージ一覧の取得
zilliz stage list
# オプション: --project-id <フィルター対象のプロジェクトID>
# ページネーション: --page-size <件数> --page <ページ番号>
# 全ページ取得: --all
ステージの作成
zilliz stage create \
--project-id <所有プロジェクトID> \
--region-id <クラウドリージョン> \
--stage-name <ステージ名>
ステージの削除
zilliz stage delete --stage-name <ステージ名>
ステージの適用(Apply)
zilliz stage apply --stage-name <ステージ名>
# オプション:
# --project-id <プロジェクトID>
# --region-id <リージョンID>
# --cluster-id <ターゲットクラスターID>
# --path <ステージサブパス>
インテグレーションのセットアップ
インポートを行うには、データファイルにアクセスするためのクラウドストレージ インテグレーションが必要です。
integration-id は、Zilliz Cloudコンソールの Project Settings > Integrations で設定します。
インテグレーションに、ソースバケットおよびパスへの読み取りアクセス権が付与されていることを確認してください。
対応ファイル形式: Parquet、JSON、CSV
ステージ vs. ダイレクトインテグレーション
ステージとは、マネージドクラウドストレージ上に事前アップロードされたファイル群に対して、プロジェクトスコープで名前を付けて参照するための識別子です。
インポートジョブが参照する対象は、以下のいずれかになります:
- インテグレーション経由でアクセスするユーザー所有のバケット(上記の従来フロー)、または
- ステージ(
zilliz stage create --project-id <id> --region-id <region> --stage-name <name>)。
ステージングバケットをZilliz Cloudにホストさせたい場合に推奨されます。
stage apply は既存のステージをその場で更新します。stage delete はステージを削除します
(実行前にユーザーへ確認を促してください。そのステージを参照している処理中のインポートジョブは失敗します)。
インポートターゲットの指定方法
import start、import list、import status は、以下のいずれかの形式を受け付けます:
--cluster-id <id>(レガシー形式、現在も使用可能)、または--project-id <id>と--region-id <region>の組み合わせ
(サーバーがプロジェクトとリージョンのペアからターゲットインスタンスを解決します)。
どちらか一方の形式を正確に1つ指定する必要があります。
いずれも指定しない場合、または --project-id のみで --region-id を省略した場合、CLIはエラーを返します。
ガイダンス
- インポートジョブは非同期で実行されます。ジョブ開始後は
import statusを使って進捗を確認してください。 - データファイルは、Zilliz Cloudからアクセス可能な状態である必要があります(設定済みのインテグレーション経由、またはステージ経由)。
- コレクションのスキーマは、データファイルの構造と一致していなければなりません。
- Vector Lake / オンデマンドクラスター構成にインポートする場合は、
--project-id+--region-idの形式を推奨します。オンデマンドクラスターには、固定の単一クラスターIDが存在しないためです。
原文(English)を表示
Prerequisites
- CLI installed and logged in (see setup skill).
- Target collection must exist on the target cluster.
Commands Reference
Import Jobs
Start an Import Job
zilliz import start --collection <target-collection-name>
# Optional:
# --cluster-id <target-cluster-id>
# --project-id <project-id>
# --region-id <region-id>
# Or use raw JSON: --body '{"files": [["s3://bucket/path/data.parquet"]]}'
List Imports
zilliz import list
# Optional:
# --cluster-id <cluster-id>
# --project-id <project-id>
# --region-id <region-id>
# --database <database-name>
Check Import Status
zilliz import status --job-id <import-job-id>
# Optional:
# --cluster-id <cluster-id>
# --project-id <project-id>
# --region-id <region-id>
Import Stages
List Stages
zilliz stage list
# Optional: --project-id <filter-by-project-id>
# Pagination: --page-size <n> --page <n>
# Fetch all pages: --all
Create a Stage
zilliz stage create \
--project-id <owning-project-id> \
--region-id <cloud-region> \
--stage-name <stage-name>
Delete a Stage
zilliz stage delete --stage-name <stage-name>
Apply
zilliz stage apply --stage-name <stage-name>
# Optional:
# --project-id <project-id>
# --region-id <region-id>
# --cluster-id <target-cluster-id>
# --path <stage-subpath>
Integration Setup
Import requires a cloud storage integration to access data files. The integration-id is configured in the Zilliz Cloud console under Project Settings > Integrations. Ensure the integration has read access to the source bucket and path.
Supported file formats: Parquet, JSON, CSV.
Stages vs. Direct Integrations
A stage is a named, project-scoped handle to a pre-uploaded set of files in managed cloud storage. Import jobs reference either:
- a customer-owned bucket via an integration (the original flow above), or
- a stage (
zilliz stage create --project-id <id> --region-id <region> --stage-name <name>), which is preferable when the user wants Zilliz Cloud to host the staging bucket.
stage apply updates an existing stage in place; stage delete removes it
(confirm with the user first -- pending import jobs referencing the stage
will fail).
Import Targets
import start, import list, and import status accept either:
--cluster-id <id>(legacy form, still supported), or--project-id <id>together with--region-id <region>(the server then resolves the target instance from the project + region pair).
You must supply exactly one of those two grouping forms -- the CLI rejects
an import command that provides neither, or that provides --project-id
without --region-id.
Guidance
- Import jobs run asynchronously. After starting a job, use
import statusto track progress. - The data files must be accessible from Zilliz Cloud (either via a configured integration or via a stage).
- The collection schema must match the data file structure.
- When importing into a Vector Lake / on-demand-cluster setup, prefer the
--project-id+--region-idform -- on-demand clusters do not have a stable single cluster ID to point at.
原文・著作権は Anthropic および各プラグイン作者に帰属します。日本語訳は Claude API による自動翻訳です。