Precios de Dataproc
Precios de Dataproc on Compute Engine
Los precios de Dataproc en Compute Engine se basan en el tamaño de los clústeres de Dataproc y durante el tiempo que se ejecutan. El tamaño de un clúster se calcula según la cantidad total de CPU virtuales de todo el clúster, incluidos los nodos trabajadores y los principales. La duración de un clúster es el tiempo que transcurre entre su creación y su detención o eliminación.
Esta es la fórmula para calcular los precios de Dataproc: $0.010 * # of vCPUs * hourly duration
.
Si bien la fórmula para calcular el precio se expresa como una tarifa por hora, Dataproc se factura por segundo y todos los clústeres de Dataproc se facturan en incrementos de tiempo de un segundo y están sujetos a una facturación mínima de 1 minuto. El uso se expresa en fracciones de hora (por ejemplo, 30 minutos se expresan como 0.5 horas) para aplicar los precios por hora al uso por segundos.
Los precios de Dataproc se suman al precio por instancia de Compute Engine para cada máquina virtual (consulta la página sobre el uso de otros recursos de Google Cloud).
Ejemplo de precios
Por ejemplo, considera un clúster (con una instancia principal y nodos trabajadores) que tiene la siguiente configuración:
Elemento | Tipo de máquina | CPU virtuales | Disco persistente conectado | Cantidad en el clúster |
---|---|---|---|---|
Nodo principal | n1-standard-4 | 4 | 500 GB | 1 |
Nodos trabajadores | n1-standard-4 | 4 | 500 GB | 5 |
Este clúster de Dataproc tiene 24 CPU virtuales, 4 para el nodo principal y 20 distribuidas entre los nodos trabajadores. Para los propósitos de facturación de Dataproc y si suponemos que no se disminuyó la escala de los nodos ni se interrumpieron, el precio de este clúster se calcularía según esas 24 CPU virtuales y la cantidad de tiempo durante el que se ejecutó ese clúster. Si el clúster se ejecuta durante 2 horas, se usaría la siguiente fórmula de precios de Dataproc:
Dataproc charge = # of vCPUs * hours * Dataproc price = 24 * 2 * $0.01 = $0.48
En este ejemplo, el clúster también tendría cobros asociados a Compute Engine y al espacio de disco persistente estándar, además del cobro de Dataproc (consulta la sección Uso de otros recursos de Google Cloud). Puedes usar la calculadora de facturación para determinar los costos de los recursos de Google Cloud por separado.
Uso de otros recursos de Google Cloud
Como una solución integrada y administrada, Dataproc se creó a partir de otras tecnologías de Google Cloud. Los clústeres de Dataproc consumen los siguientes recursos, cada uno facturado según sus propios precios:
- Compute Engine: todas las instancias de Compute Engine de un clúster de Dataproc tienen un mínimo de 1 minuto y se facturan en función de los incrementos de facturación por segundo y las reglas de fijación de precios por uso continuo
- Espacio aprovisionado de disco persistente estándar
- Cloud Monitoring: Consulta los precios de observabilidad de Google Cloud
De manera opcional, los clústeres de Dataproc pueden usar recursos, que se facturan según sus propios precios, entre los que se encuentran los siguientes:
Precios de Dataproc on GKE
En esta sección, se explican los cargos que se aplican solo al clúster virtual de Dataproc que se ejecuta en un GKE administrado por el usuario. Consulta los precios de GKE para obtener información sobre los cargos adicionales que se aplican al clúster de GKE administrado por el usuario.
La fórmula de precios de Dataproc en GKE, $0.010 * # of vCPUs * hourly duration
, es la misma que la fórmula de precios de Dataproc en Compute Engine y se aplica a la cantidad total de CPUs virtuales que se ejecutan en instancias de VM en los grupos de nodos creados por Dataproc en el clúster. La duración de una instancia de máquina virtual es el tiempo que transcurre desde su creación hasta su eliminación. Al igual que con Dataproc en Compute Engine, Dataproc on GKE se factura por segundo, sujeto a una facturación mínima de 1 minuto por instancia de máquina virtual. Se aplican otros cargos de Google Cloud además de los cargos de Dataproc.
Los grupos de nodos creados por Dataproc continúan existiendo después de la eliminación del clúster de Dataproc, ya que pueden compartirse con varios clústeres. Si borras los grupos de nodos o escalas los grupos de nodos a cero instancias, no se generarán cargos continuos de Dataproc. Todas las VMs del grupo de nodos restantes seguirán generando cargos hasta que las borres.
Precios de Dataproc Serverless
Consulta los precios de Dataproc Serverless.
¿Qué sigue?
- Lee la documentación de Dataproc.
- Comienza a usar Dataproc.
- Prueba la calculadora de precios.
- Obtén información sobre las soluciones y los casos de uso de Dataproc.