BigLake adalah mesin penyimpanan yang menyediakan antarmuka terpadu untuk mesin AI dan analisis guna mengkueri data multiformat, multicloud, dan multimodal dengan cara yang aman, teratur, dan berperforma tinggi. Bangun lakehouse AI salinan tunggal yang dirancang untuk mengurangi pengelolaan dan kebutuhan infrastruktur data kustom.
Inovasi berkelanjutan termasuk riset baru yang berjudul BigQuery's Evolution toward a Multi-Cloud Lakehouse akan ditampilkan dalam acara SIGMOD 2024.
Deploy solusi yang direkomendasikan Google yang menyatukan data lake dan data warehouse untuk menyimpan, memproses, dan menganalisis data terstruktur dan tidak terstruktur
Simpan satu salinan data serta kueri terstruktur dan tidak terstruktur menggunakan alat analisis dan AI
Akses kontrol yang mendetail dan tata kelola multicloud terhadap data yang terdistribusi
Pengalaman yang terkelola sepenuhnya dengan pengelolaan data otomatis untuk lakehouse format terbuka Anda
Manfaat
Dapatkan analisis tentang data terdistribusi terlepas dari tempat dan caranya disimpan, sembari memilih alat analisis terbaik, open source atau berbasis cloud, untuk salinan tunggal data.
Akses kontrol yang mendetail di semua mesin open source seperti Apache Spark, Presto, dan Trino, serta format terbuka seperti Parquet. Kueri berperforma tinggi terhadap data lake yang didukung oleh BigQuery.
Integrasikan dengan Dataplex untuk memberi pengelolaan dalam skala besar, termasuk pengaturan data logis, pengelolaan kebijakan & metadata terpusat, serta pengelolaan kualitas dan siklus proses untuk menjaga konsistensi di seluruh data terdistribusi.
Fitur utama
BigLake meniadakan kebutuhan untuk memberikan akses tingkat file kepada pengguna akhir. Terapkan kebijakan keamanan tingkat tabel, baris, dan kolom pada tabel penyimpanan objek seperti tabel BigQuery yang sudah ada.
Kelola salinan tunggal data terstruktur dan tidak terstruktur serta atur agar dapat diakses secara seragam di berbagai mesin open source serta Google Cloud, termasuk BigQuery, Vertex AI, Dataflow, Spark, Presto, Trino, dan Hive menggunakan konektor BigLake. Kelola kebijakan keamanan secara terpusat dalam satu tempat, dan atur agar konsisten diterapkan di berbagai mesin kueri dengan antarmuka API yang terintegrasi ke dalam konektor.
Temukan semua tabel BigLake, termasuk tabel yang ditentukan dalam Amazon S3 dan Azure data lake Gen 2 di Data Catalog. Konfigurasi kontrol akses yang mendetail dan atur agar diterapkan di seluruh cloud ketika menjalankan kueri dengan BigQuery Omni.
Tabel objek memungkinkan penggunaan data multimodal untuk workload AI yang diatur. Bangun kasus penggunaan AI dengan mudah menggunakan BigQuery SQL dan integrasi Vertex AI-nya.
Mendukung format tabel dan file terbuka termasuk Parquet, Avro, ORC, CSV, JSON. API-nya melayani beberapa compute engine melalui Apache Arrow. Format tabel secara native mendukung Apache Iceberg, Delta, dan Hudi melalui manifes.
Yang baru
Dokumentasi
Pelajari cara membuat kueri data yang tersimpan di tabel BigLake Cloud Storage.
Harga
Harga BigLake didasarkan pada proses kueri tabel BigLake yang mencakup:
1. Harga BigQuery berlaku untuk kueri pada tabel BigLake yang ditetapkan di Google Cloud Storage.
2. Harga BigQuery Omni berlaku untuk kueri pada tabel BigLake yang ditetapkan di Amazon S3 & Azure data lake Gen 2.
3. Kueri dari mesin open-source yang menggunakan konektor BigLake: Konektor BigLake menggunakan BigQuery Storage API, dan biaya terkait berlaku yang ditagih untuk byte yang dibaca serta traffic keluar.
4. Biaya tambahan berlaku untuk akselerasi kueri yang menggunakan caching metadata, tabel objek, dan BigLake Metastore.
Misalnya: *Gratis 1 TB data pertama yang diproses dengan BigQuery setiap bulan.
Mulailah membangun solusi di Google Cloud dengan kredit gratis senilai $300 dan lebih dari 20 produk yang selalu gratis.