DuckDB

Databases

DuckDB wordt steeds vaker toegepast voor het razendsnel analyseren van grote datasets binnen data-analyse, Geo-ICT, AI en moderne analytics workflows. Organisaties gebruiken DuckDB bijvoorbeeld voor het verwerken van Parquet-bestanden, het analyseren van miljoenen records zonder zware databaseserver en het combineren van SQL met Python- en R-omgevingen. Dankzij de hoge prestaties en eenvoudige inzetbaarheid groeit DuckDB snel uit tot een populair alternatief voor traditionele analytics databases.

Studiebelasting 2 dagen

Onderwezen door:

Joris op ten Berg

Cursus DuckDB Basis

DuckDB wordt steeds vaker toegepast voor het razendsnel analyseren van grote datasets binnen data-analyse, Geo-ICT, AI en moderne analytics workflows. Organisaties gebruiken DuckDB bijvoorbeeld voor het verwerken van Parquet-bestanden, het analyseren van miljoenen records zonder zware databaseserver en het combineren van SQL met Python- en R-omgevingen.

DuckDB is een moderne, embedded analytics database die speciaal is ontworpen voor snelle analytische queries. In tegenstelling tot traditionele databaseservers hoeft DuckDB niet als aparte server te worden geïnstalleerd of beheerd. Hierdoor is DuckDB bijzonder geschikt voor data-analisten, GIS-specialisten, onderzoekers en ontwikkelaars die direct vanuit bestanden, scripts of notebooks willen werken.

Een belangrijk voordeel van DuckDB is de sterke ondersteuning voor moderne dataformaten zoals CSV, JSON en Parquet. Vooral Parquet speelt een steeds grotere rol binnen data engineering, cloud data lakes, GeoAI en schaalbare analyseomgevingen. Met DuckDB kunnen deze bestanden rechtstreeks worden bevraagd met SQL, zonder dat de data eerst in een zware databaseomgeving hoeft te worden geladen.

DuckDB sluit goed aan op moderne workflows met Python, R, Pandas, Polars en Jupyter notebooks. Daardoor vormt DuckDB een praktische brug tussen klassieke SQL-analyse en moderne data science. Deelnemers leren hoe zij grote datasets efficiënt kunnen analyseren, combineren en voorbereiden voor rapportages, dashboards, modellen en verdere verwerking.

Waarom een Cursus DuckDB Basis?

DuckDB is interessant voor iedereen die met data-analyse, data engineering of Geo-ICT werkt en sneller, eenvoudiger en flexibeler met grote datasets wil omgaan. De database combineert de kracht van SQL met het gemak van werken vanuit bestanden en programmeeromgevingen.

  • Snelheid: DuckDB is geoptimaliseerd voor analytische queries en kan grote datasets zeer efficiënt verwerken.
  • Eenvoud: Er is geen complexe serverinstallatie nodig. DuckDB kan direct lokaal of embedded worden gebruikt.
  • Moderne dataformaten: DuckDB werkt uitstekend met CSV, JSON en vooral Parquet.
  • Integratie: DuckDB sluit goed aan op Python, R, Pandas, Polars en notebook-omgevingen.
  • Toepasbaarheid: DuckDB is geschikt voor data-analyse, rapportage, ETL, AI-workflows en Geo-ICT toepassingen.

Belangrijke punten bij het werken met DuckDB:

  • Embedded analytics: DuckDB kan direct in applicaties, scripts en notebooks worden gebruikt.
  • SQL voor analyse: Deelnemers leren data bevragen, filteren, aggregeren en combineren met SQL.
  • Bestandsgericht werken: Data kan rechtstreeks uit bestanden worden gelezen zonder deze eerst te importeren.
  • Performance: DuckDB maakt gebruik van kolomgerichte verwerking en slimme optimalisaties.
  • Data engineering: DuckDB is geschikt voor het bouwen van lichte, snelle en reproduceerbare data workflows.

De Basis: Wat is DuckDB en Hoe Werkt Het?

DuckDB is een relationele database die is ontworpen voor analytische workloads. Waar traditionele databases vaak gericht zijn op transactieverwerking, is DuckDB vooral sterk in het uitvoeren van snelle analyses op grote hoeveelheden data. Dit maakt DuckDB geschikt voor toepassingen waarin datasets moeten worden onderzocht, opgeschoond, samengevoegd en geanalyseerd.

Kenmerken van DuckDB:

  • Embedded database: DuckDB draait direct binnen een applicatie, script of notebook en vereist geen aparte databaseserver.
  • Kolomgerichte verwerking: DuckDB is geoptimaliseerd voor analytische queries waarbij grote aantallen rijen worden verwerkt.
  • SQL-ondersteuning: Gebruikers kunnen werken met bekende SQL-concepten zoals selecties, joins, aggregaties en views.
  • Bestandsintegratie: CSV-, JSON- en Parquet-bestanden kunnen direct worden bevraagd.

Moderne Dataformaten Uitgelicht:

  • CSV: Veelgebruikte tabelbestanden kunnen snel worden ingelezen, gecontroleerd en geanalyseerd.
  • JSON: Semi-gestructureerde data kan worden verwerkt en omgezet naar bruikbare analysevormen.
  • Parquet: Kolomgericht opslagformaat dat zeer geschikt is voor grote datasets en moderne data lake workflows.

DuckDB maakt het mogelijk om snel van ruwe data naar bruikbare inzichten te komen. Daardoor is het een waardevol hulpmiddel voor professionals die efficiënt willen werken met grote datasets zonder meteen een complexe database-infrastructuur op te zetten.

Wat leer je in de Cursus DuckDB Basis

Data-analyse met SQL en DuckDB

In deze cursus leren deelnemers hoe zij DuckDB kunnen gebruiken voor praktische data-analyse. Daarbij ligt de nadruk op het schrijven van duidelijke SQL-query’s, het werken met tabellen en bestanden en het uitvoeren van analyses op grotere datasets.

Belangrijke Concepten in DuckDB:

  • Tabellen en views: Het structureren van data voor analyse en hergebruik.
  • SQL-query’s: Het selecteren, filteren, sorteren en aggregeren van gegevens.
  • Joins: Het combineren van verschillende datasets tot één analyseomgeving.
  • Aggregaties: Het samenvatten van data met totalen, gemiddelden, tellingen en groepen.

Werken met Bestanden in DuckDB:

  • CSV-bestanden: Data importeren, controleren en direct bevragen.
  • JSON-bestanden: Semi-gestructureerde data verwerken en analyseren.
  • Parquet-bestanden: Grote datasets efficiënt opslaan en analyseren.

DuckDB in Python, R en Data Workflows

DuckDB wordt vaak gebruikt in combinatie met programmeertalen en data science omgevingen. In de cursus leren deelnemers hoe DuckDB past binnen moderne workflows met Python, R en DataFrames.

  • Python-integratie: DuckDB gebruiken vanuit Python scripts en notebooks.
  • R-integratie: DuckDB toepassen binnen R workflows voor analyse en rapportage.
  • DataFrames: Data uitwisselen met Pandas, Polars en vergelijkbare omgevingen.
  • ETL-workflows: Data inlezen, transformeren en wegschrijven naar moderne bestandsformaten.

Praktische Toepassingen:

  • Data-analyse: Grote datasets snel onderzoeken en samenvatten.
  • Rapportage: Data voorbereiden voor dashboards, rapporten en visualisaties.
  • Data engineering: Lichte en reproduceerbare pipelines bouwen met SQL, Python of R.
  • Geo-ICT: Data voorbereiden voor verdere analyse binnen GIS, GeoAI en GeoParquet workflows.

Het effectief gebruiken van DuckDB helpt professionals om sneller en eenvoudiger met moderne databronnen te werken. De cursus biedt een stevige basis voor iedereen die DuckDB wil inzetten binnen data-analyse, data engineering, AI of Geo-ICT.

Waarom kiezen voor onze Cursus DuckDB Basis?

Het kiezen voor onze cursus DuckDB Fundament bij Geo-ICT Training Center biedt unieke voordelen. We combineren actuele kennis over moderne data-analyse met praktische toepassingen binnen Geo-ICT, data engineering en analytics workflows. De cursus is praktijkgericht opgezet, zodat deelnemers niet alleen leren wat DuckDB is, maar vooral hoe zij DuckDB direct kunnen toepassen in hun eigen werk. Dankzij onze focus op GIS, GeoAI, open source tooling en moderne datastandaarden vormt deze cursus een sterke basis voor professionals die toekomstgericht met data willen werken.

Meer lezen

Inschrijven

€1095,-
  • Studiebelasting2 Lesdag(en) van 9.00 tot 16.00 uur.
  • Location: Apeldoorn of Online. Op locatie is mogelijk, vraag dan een offerte aan.
Inschrijven voor deze cursus

Dagindeling

Dag 1 – Fundamenten van DuckDB en Moderne Data-analyse

Tijdens de eerste cursusdag maken deelnemers uitgebreid kennis met DuckDB als moderne analytics database. Er wordt gestart met de architectuur en filosofie achter DuckDB en de verschillen met traditionele databases zoals PostgreSQL, MySQL en SQLite. Deelnemers leren waarom DuckDB bijzonder geschikt is voor analytische workloads, embedded toepassingen en moderne data engineering workflows.

Vervolgens wordt ingegaan op het werken met SQL binnen DuckDB. Hierbij komen belangrijke onderwerpen aan bod zoals selecties, filters, joins, aggregaties en het combineren van datasets. Daarnaast leren deelnemers hoe zij rechtstreeks kunnen werken met CSV-, JSON- en Parquet-bestanden zonder complexe importprocessen. Ook wordt aandacht besteed aan performance, kolomgerichte verwerking en het efficiënt analyseren van grotere datasets.

Gedurende de dag werken deelnemers praktijkgericht met datasets en leren zij hoe DuckDB ingezet kan worden voor data-analyse, rapportage en lichte ETL-processen.

Dag 2 – Geavanceerde Analyse en Werken met Moderne Dataformaten

Tijdens de tweede cursusdag verdiepen deelnemers zich verder in de analysemogelijkheden van DuckDB en het werken met moderne databronnen. De nadruk ligt op het efficiënt verwerken van grotere datasets en het uitvoeren van complexere SQL-analyses binnen een moderne analytics omgeving.

Deelnemers leren hoe datasets uit verschillende bronnen gecombineerd kunnen worden en hoe DuckDB ingezet kan worden voor filtering, aggregaties, joins en analytische query’s op grote hoeveelheden data. Daarbij wordt uitgebreid gewerkt met CSV-, JSON- en vooral Parquet-bestanden. Ook wordt aandacht besteed aan het optimaliseren van query’s en het begrijpen van de prestaties van DuckDB bij analytische workloads.

Daarnaast wordt ingegaan op moderne data engineering concepten zoals kolomgerichte opslag, embedded analytics en data lake workflows. Deelnemers ontdekken hoe DuckDB direct op bestanden kan werken zonder zware database-infrastructuren en waarom DuckDB steeds vaker wordt toegepast binnen analytics, AI en Geo-ICT omgevingen.

Gedurende de dag werken deelnemers praktijkgericht met datasets en voeren zij verschillende analyses uit. Aan het einde van de cursus hebben deelnemers een stevige basis om DuckDB zelfstandig in te zetten voor moderne data-analyse en analytics workflows.

Studiebelasting 2 dagen
Schrijf me in

Leerdoelen

  • U leert hoe DuckDB als moderne analytics database gebruikt kan worden voor het analyseren van grote datasets.
  • U leert werken met SQL-query’s binnen DuckDB, inclusief filters, joins, aggregaties en analytische bewerkingen.
  • U leert hoe CSV-, JSON- en Parquet-bestanden rechtstreeks kunnen worden ingelezen, gecombineerd en geanalyseerd.
  • U leert hoe DuckDB prestaties behaalt met kolomgerichte verwerking en embedded analytics concepten.
  • U leert hoe DuckDB toegepast kan worden binnen moderne data-analyse, data engineering en Geo-ICT workflows.

Meer informatie?

Heb je vragen over de inhoud van de cursus? Of twijfel je of de cursus aansluit bij jouw leerdoelen of wensen? Liever incompany of een privé cursus? We helpen je graag verder.

FAQ's DuckDB

PostgreSQL is vooral ontworpen als servergebaseerde relationele database voor transactieverwerking en multi-user omgevingen. DuckDB richt zich juist op analytische workloads en draait embedded zonder aparte serverinstallatie. Hierdoor is DuckDB bijzonder geschikt voor snelle analyses op grote bestanden en datasets.

DuckDB maakt gebruik van kolomgerichte verwerking en vectorized execution. Hierdoor hoeft de database alleen de relevante kolommen te lezen en kunnen analytische query’s zeer efficiënt worden uitgevoerd. Dit maakt DuckDB bijzonder geschikt voor aggregaties, filtering en analyses op grote datasets.

SQLite is vooral ontworpen voor lichte transactionele toepassingen en embedded applicaties. DuckDB heeft een vergelijkbare eenvoudige architectuur, maar is specifiek geoptimaliseerd voor data-analyse en analytische workloads. DuckDB biedt daardoor betere prestaties bij grote datasets en complexe analyses.

Parquet is een kolomgericht bestandsformaat dat efficiënt werkt met analytische databases zoals DuckDB. DuckDB kan Parquet-bestanden rechtstreeks bevragen zonder complexe importprocessen. Hierdoor kunnen grote datasets snel worden geanalyseerd binnen moderne data engineering, AI en Geo-ICT workflows.