Veri Analizi

Apache Parquet Nedir ?

Parquet Apache tarafından geliştirilmiş bir veri depolama formatıdır. Özellikle büyük veriler üzerinde işlem yaparken faydalar sağlamaktadır. Aws , Google gibi bulut sistemlerinde doğrudan desteklediği bu sistem csv ye göre çok daha yüksek performans sağlamaktadır.

Neden Parquet ?

  • Ücretsiz ve açık kaynak dosya formatı.
  • Dil agnostiği.
  • Sütun tabanlı biçim – dosyalar satır yerine sütuna göre düzenlenir, bu da depolama alanından tasarruf sağlar ve analiz sorgularını hızlandırır.
  • Genellikle geleneksel OLTP veritabanlarıyla birlikte analitik (OLAP) kullanım örnekleri için kullanılır .
  • Yüksek verimli veri sıkıştırma ve açma işlemleri sağlar.
  • Karmaşık veri türlerini ve gelişmiş iç içe geçmiş veri yapılarını destekler
5 1 vote
Article Rating
Subscribe
Bildir
guest
0 Yorum
Inline Feedbacks
View all comments