Dataproc supporta gli endpoint a livello di regione basati Regioni di Compute Engine. Devi specificare una regione, ad esempio "us-east1" o "europe-west1", quando crei un cluster Dataproc. Dataproc le risorse del cluster, come le istanze VM e Cloud Storage, verranno isolate e archiviazione dei metadati, all'interno di una zona all'interno della regione specificata.
Facoltativamente, puoi specificare una zona all'interno della regione specificata per il cluster, ad esempio "us-east1-a" o "europe-west1-b", quando crei un cluster. In caso contrario specificare la zona Posizionamento automatico della zona Dataproc sceglierà una zona all'interno della regione specificata per il cluster per individuare i cluster Google Cloud.
Lo spazio dei nomi regionale corrisponde al /regions/REGION
segmento di URI delle risorse Dataproc (vedi, ad esempio, il
cluster
networkUri
).
semantica dell'endpoint a livello di regione
I nomi degli endpoint a livello di regione seguono una convenzione di denominazione standard basata su
Regioni di Compute Engine.
Ad esempio, il nome della regione degli Stati Uniti centrali è us-central1
e quello
della regione dell'Europa occidentale è europe-west1
. Esegui gcloud compute regions list
per vedere un elenco delle regioni disponibili.
Crea un cluster
gcloud
Quando crei un cluster, specifica una regione utilizzando il campo
--region
flag.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Utilizza il parametro URL REGION
in una
clusters.create
per specificare la regione del cluster.
gRPC
Imposta l'indirizzo di trasporto del client sull'endpoint a livello di regione utilizzando il seguente pattern:
REGION-dataproc.googleapis.com
Esempio di Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Esempio di Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Console
Specifica una regione Dataproc nella sezione Località del Riquadro Configura cluster su Dataproc Pagina Crea un cluster nella console Google Cloud.
Passaggi successivi
- Area geografica e regioni
- Compute Engine→Regioni e zone
- Compute Engine→Risorse globali, a livello di regione e di zona
- Posizionamento in base alla zona automatica di Dataproc