PySpark, MongoDB en Bokeh

Cursusduur: 8 uren

Bouw een intelligente data-pijplijn met behulp van Apache Spark en MongoDB big data-technologieën.

Welkom bij de cursus Big Data Pipelines bouwen met PySpark & MongoDB & Bokeh. In deze cursus gaan we een intelligente data pipeline bouwen met behulp van big data technologieën zoals Apache Spark en MongoDB. De pijplijn is ETLP. ETLP staat voor Extract, Transform, Load en Predict. Dit zijn de verschillende fasen van de datapijplijn die onze data moeten doorlopen om ze uiteindelijk bruikbaar te maken. Zodra de data door deze pijplijn zijn gegaan, kunnen we de data gebruiken voor het maken van rapporten en dashboards voor data-analyse.

De data-pijplijn die we zullen bouwen bestaat uit “dataverwerking”  met PySpark, “voorspellende modellering” met Spark’s MLlib machine learning library en data-analyse met MongoDB en Bokeh.

Inschrijven MOOC


    Na verzenden krijgt u per ommegaande de link toegestuurd die toegang geeft tot de leeromgeving.

    Leerdoelen

    • Hoe je dataverwerkings-pijplijnen maakt met PySpark.
    • Machine learning met geo-spatiale data met behulp van de Spark MLlib bibliotheek.
    • Data-analyse met PySpark, MongoDB en Bokeh, in jupyter notebook.
    • Hoe je data manipuleert, opschoont en transformeert met PySpark dataframes.
    • Basis geo-mapping.
    • Hoe dashboards te maken.
    • Hoe je een lichtgewicht server maakt om bokeh-dashboards op te plaatsen.

    Meer informatie?

    Heb je vragen over de inhoud van de cursus? Of twijfel je of de cursus aansluit bij jouw leerdoelen of wensen? Liever incompany of een privé cursus? We helpen je graag verder.

    Veelgestelde vragen

    Na de cursus mag je nog 2 weken vragen stellen aan de docent. De docent geeft al weer andere cursussen dus het best kun je je vragen mailen naar info@geo-ict.nl. Je vraag wordt voorgelegd aan de docent en binnen 24 uur krijg je antwoord op je vraag.

    Als je al wat verder bent en je loopt in de praktijk tegen problemen op waar je zelf niet uit komt dan kun je het best gebruik gaan maken van een Online Support. Je gaat dan één dag online met de docent en je krijgt 1 op 1 maatwerk les. Al je problemen worden opgelost en je bent een flinke stap verder gekomen.

    Als je in de praktijk tegen problemen op loopt waar je zelf niet uit komt dan kun je 2 dingen doen. Je schrijft je in voor een basis of gevorderde cursus of je schrijft je in voor Online Support.

    Je gaat dan één dag online met een docent en je krijgt 1 op 1 maatwerk les. Al je problemen worden opgelost en je bent een flinke stap verder gekomen.

     

    Alle cursussen worden in contact les gegeven. De cursustijden zijn van 9.00 tot 16.00 uur. Voor koffie, thee, lunch en laptop wordt gezorgd. Online mee doen kan ook altijd. Je zit dan thuis op je eigen laptop en volgt de cursus in Google Meet mee. De lunch, koffie en thee moet je dan wel zorg voor zorgen.

    Je kunt per cursusdag beslissen of je naar onze locatie komt of dat je het online wil doen. Geef dit dan wel op tijd door aan de cursuscoördinator.

    Ja, dit doen we regelmatig. Onze docent komt dan naar uw locatie toe. Hij heeft laptops voor de cursisten bij zich. U hoeft alleen maar een lokaal bij u op locatie te regelen.

    U kunt uw wensen doormailen naar info@geo-ict.nl  dan mailen we u een offerte. Na opdrachtverlening neemt onze cursuscoördinator contact met u op om de lesdagen in te plannen.

    Na iedere cursus krijgen de cursisten een link naar ons evaluatieportaal. Daar kunt u melden wat je wel en niet goed vond aan de cursus. We doen altijd ons uiterste best maar toch kan het natuurlijk voorkomen dat u een klacht heeft. Klik op Klachtenregeling.  Daarin staat beschreven wat u kunt doen. Geo-ICT Training Center, Nederland is lid van de Nederlandse Raad voor Trainen en Opleiden ( NRTO ).

    Na de cursus mailen we u een link naar ons evaluatieportaal. Daar kun u inloggen en een evaluatieformulier in vullen en daar kunt u ook uw deelname certificaat downloaden.