Apache Parquet, c'est quoi ??

Merci à Xavki pour sa contribution le 02/05/2023

xavki
Francais Francais
database
datascience
📽️ Abonnez-vous : http://bit.ly/2UnOdgi
🖥️ Devenir membre VIP : https://bit.ly/3dItQU9
👂 Podcast : https://podcast.ausha.co/xavki/

Apache Parquet est un format de fichier très connu dans le stockage de la données et notamment pour le stockage en datascience. Dans ce tutoriel, nous allons découvrir ses particularités notamment pour ses performances en matière de compression et d'encodage.

En outre, nous abordons les fichiers parquet dans la playlist #clickhouse car ils font partie des formats supportés par clichouse. Parquet est utilisable par de nombreux outil tels que drill, duckdb, trino... Et ses capacités de compression et d'interrogation le rendre très pratique pour valoriser du stockage S3.

Site officiel : https://parquet.apache.org/
Github : https://github.com/apache/parquet-format

Sommaire de plus de 1500 vidéos :
- sur github : https://bit.ly/2P5x8Xj
- sur gitlab : https://bit.ly/2BvYouO

➡️ ➡️ Vous voulez m'encourager likez la vidéo, commentez-là et abonnez-vous ! 😃