Platform voor starters in de geosector

200 cursussen, 20 online supports, 60 moocs,

50 trainees, omscholers, specialisten en docenten

Leslocaties: Apeldoorn, Virtueel(online), In company 

Cursus: Python en Datascience

Deze cursus Python en Datascience duurt 4 dagen en kost €1999,- excl. BTW.

Om aan deze cursus te kunnen deelnemen is kennis van- en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk.

Omschrijving

Tijdens de cursus Python en Datascience leert u werken met de diverse packages ( NumPy, SciPy, Pandas) die voor datascience toepassingen erg  nuttig zijn. 

Inhoud 

Het belang van data-analyse en data-science is enorm toegenomen en de programmeertaal Python is hierbij een van de belangrijkste hulpmiddelen geworden. Met behulp van een aantal gespecialiseerde bibliotheken, zoals NumPy, Pandas en Matplotlib, is Python uitgegroeid tot misschien wel het belangrijkste hulpmiddel voor het analyseren en visualiseren van allerlei data.

Dagindeling

Dag 1

Als eerste worden de Python syntax-aspecten behandeld. Deze zijn belangrijk bij Data Science-projecten. Variabelen, datatypes, functies, flow-control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.

Dag 2:

Vervolgens komt het NumPy package aan de orde, waarmee grote data sets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy’s ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array-manipulatietechnieken en speciale routines voor het ordenen, zoeken en vergelijken van data in matrices. Hierbij wordt ook de MatPlotlib library besproken. Deze is nauw geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe datarelaties.

Dag 3:

Daarna is het de beurt aan het gebruik van Pandas voor data-analyse. De Pandas library introduceert twee nieuwe datastructures in Python, die gebruik maken van Numpy en daarom zeer snel zijn. De datastructures zijn DataFrame en Series en er wordt uitgebreid ingegaan op hoe u deze kunt gebruiken voor data-analyses bij het inspecteren, selecteren, filteren, combineren en groeperen van data.

Dag 4:

Ten slotte wordt aandacht besteed aan de essentials van de SciPy library.

De cursus maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één-, twee- en driedimensionale datasets kunnen worden gevisualiseerd.

De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo’s verduidelijken de concepten verder. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt.

    NeeJa


    Leerdoelen

    • De cursist kant verschillende datascience bibliotheken gebruiken om complexe analyses uit te voeren
    • De cursist kan zelfstandig verschillende analyses uitvoeren in Python

    Geo-ICT Training Center, Nederland - Python en Datascience