Parquet Apache tarafından geliştirilmiş bir veri depolama formatıdır. Özellikle büyük veriler üzerinde işlem yaparken faydalar sağlamaktadır. Aws , Google gibi bulut sistemlerinde doğrudan desteklediği bu sistem csv ye göre çok daha yüksek performans sağlamaktadır.
Neden Parquet ?
- Ücretsiz ve açık kaynak dosya formatı.
- Dil agnostiği.
- Sütun tabanlı biçim – dosyalar satır yerine sütuna göre düzenlenir, bu da depolama alanından tasarruf sağlar ve analiz sorgularını hızlandırır.
- Genellikle geleneksel OLTP veritabanlarıyla birlikte analitik (OLAP) kullanım örnekleri için kullanılır .
- Yüksek verimli veri sıkıştırma ve açma işlemleri sağlar.
- Karmaşık veri türlerini ve gelişmiş iç içe geçmiş veri yapılarını destekler