DataFrame kavramı pandas içerisinde bir veri tipini temsil etmektedir. Dataframe tablo demektir. Pandas veri analizi kütüphanesi bu veri tipi sayesinde tablolar oluşturmaktadır. Bunu excel veya sql tabloları gibi düşünebilirsiniz. DataFrame 3 Kısımdan Oluşmaktadır. Columns – Dataframe içerisindeki sütun isimlerine karşılık gelmektedir. Index – Dataframe yani tablo içerisindeki satır başlıklarıdır. Values Dataframe tablonun verilerini temsil eder.
Python ile kolay bir şekilde parquet dosyalarını açabilirsiniz. Öncelikle projenize pandas kütüphanesini dahil etmeniz gerekmektedir. Gerekli kodlar aşağıdadır. # Hasan Çağrı Güngör import pandas as pd df=pd.read_parquet('dosyaismi.parquet')
Parquet Apache tarafından geliştirilmiş bir veri depolama formatıdır. Özellikle büyük veriler üzerinde işlem yaparken faydalar sağlamaktadır. Aws , Google gibi bulut sistemlerinde doğrudan desteklediği bu sistem csv ye göre çok daha yüksek performans sağlamaktadır. Neden Parquet ? Ücretsiz ve açık kaynak dosya formatı. Dil agnostiği. Sütun tabanlı biçim – dosyalar satır yerine sütuna göre düzenlenir, bu da depolama alanından tasarruf sağlar ve analiz sorgularını hızlandırır. Genellikle geleneksel OLTP veritabanlarıyla birlikte analitik (OLAP) kullanım örnekleri için kullanılır . Yüksek verimli veri sıkıştırma ve açma işlemleri sağlar. Karmaşık veri türlerini ve gelişmiş iç içe geçmiş veri yapılarını destekler
Pandas satır ve sütunlardan oluşan ve ismine dataframe dediğimiz yapıları oluşturmak için oluşturulmuş bir küpthanedir. Pandas içerisinde istediğimiz her satır veya sütunu manipüle edebilmemiz gerekmektedir. Peki bir sütunu nasıl silebiliriz. Company Contact Country Alfreds Futterkiste Maria Anders Germany Centro comercial Moctezuma Francisco Chang Mexico Ernst Handel Roland Mendel Austria Island Trading Helen Bennett UK Laughing Bacchus Winecellars Yoshi Tannamuri Canada Magazzini Alimentari Riuniti Giovanni Rovelli Italy Pandas Drop ile Sütun Silme – Düşürme # Sütunumun ismi df olsun df.drop("Company",axis=1) # axis=1 demek sütundan düşür demek # tablomun son halini kaydetmek istiyorsam df=df.drop("Company",axis=1) Contact Country Maria Anders Germany Francisco Chang ...
Pandas kütüphanesi gömülü olarak bir çok sistem içerisinde gelmektedir. Ancak daha karmaşık işlemler peşindeyseniz mesela istediğiniz bir sürümü yüklemek istiyorsanız veya daha önce bir sürümü sildiyseniz. pip install pandas Terminale bu komutu yazabilirsiniz Pandas’ın yüklü olması sizin onu kullanabilceğiniz anlamına gelmez . Pandas’ı projenize dahil etmek zorundasınız. Bu amaçla import pandas as pd Şeklinde pandası projenize çağırabilirsiniz. Burada “as pd” pandas ı “pd” olara
Pandas , Python için geliştirilmiş bir veri analizi kütüphanesidir. Pandasın bir çok yardımcı metot ve alt özelliği olmasına rağmen en önemli özelliği tablo işlemleri diyebiliriz. Yani pandas tablo şeklinde veriler oluşturmamızı ve bu verileri manipüle etmemizi sağlamaktadır. Bu konuda yüzlere metot içeren pandas kullanıcılara büyük kolaylık sağlamaktadır. Pandas excel , json , csv , sql gibi bir çok yapı ile entegre çalışabilmektedir. Bu da pandas’ı veri analizi kütüphanesi olarak kullanmasak bile dosya işlemek için iyi bir yardımcı kütüphane haline getiriyor. Pandas python’ın bu kadar popüler olmasında oldukça önemlidir. Çünkü Python ile veri analizi diğer programlama dilleri hatta excel vs gibi yazılımların çok ötesindedir.