Big Data Pipelines with SparkR

Cursusduur: 8 uren

Het creëren van een oplossing voor big data-analyse met behulp van big data-technologieën voor R.

Welkom bij de cursus Building Big Data Pipelines with SparkR & PowerBI & MongoDB. In deze cursus gaan we een big data analytics oplossing maken met behulp van big data technologieën voor R.

In onze voorbeeld-casus werken we met ruwe aardbevingsdata en passen we big data verwerkingstechnieken toe om de data te extraheren, transformeren en laden in bruikbare datasets. Zodra we de data hebben verwerkt en opgeschoond, gebruiken we deze als databron voor het maken van voorspellende analyses en visualisaties.

Power BI Desktop is een krachtige tool voor datavisualisatie waarmee je geavanceerde query’s, modellen en rapporten kunt maken. Met Power BI Desktop kun je verbinding maken met meerdere databronnen en deze combineren tot een datamodel. Met dit datamodel kun je visuals en dashboards bouwen die je als rapporten kunt delen met andere mensen in je organisatie.

SparkR is een R-pakket dat een lichtgewicht frontend biedt om Apache Spark te gebruiken vanuit R. SparkR biedt een gedistribueerde dataframe-implementatie die bewerkingen ondersteunt zoals selectie, filteren, aggregatie enzovoort (vergelijkbaar met R-dataframes, dplyr), maar dan op grote datasets. SparkR ondersteunt ook distributed machine learning met behulp van MLlib.

MongoDB is een document-georiënteerde NoSQL database, gebruikt voor de opslag van grote hoeveelheden data. MongoDB maakt geen gebruik van rij/kolom tabellen. Het documentmodel wordt gekoppeld aan de objecten in uw applicatiecode, waardoor de data eenvoudig te bewerken zijn.

Inschrijven MOOC


    Na verzenden krijgt u per ommegaande de link toegestuurd die toegang geeft tot de leeromgeving.

    Leerdoelen

    • Hoe je big data verwerkingspijplijnen maakt met behulp van R en MongoDB.
    • Machine learning met geo-spatiale data met behulp van SparkR en de MLlib bibliotheek.
    • Data-analyse met SparkR, R en PowerBI.
    • Hoe je data kunt manipuleren, opschonen en transformeren met behulp van Spark dataframes.
    • Geo-kaarten maken in PowerBI Desktop.
    • Dashboards maken in PowerBI Desktop.

    Meer informatie?

    Heb je vragen over de inhoud van de cursus? Of twijfel je of de cursus aansluit bij jouw leerdoelen of wensen? Liever incompany of een privé cursus? We helpen je graag verder.

    Veelgestelde vragen

    Na de cursus mag je nog 2 weken vragen stellen aan de docent. De docent geeft al weer andere cursussen dus het best kun je je vragen mailen naar info@geo-ict.nl. Je vraag wordt voorgelegd aan de docent en binnen 24 uur krijg je antwoord op je vraag.

    Als je al wat verder bent en je loopt in de praktijk tegen problemen op waar je zelf niet uit komt dan kun je het best gebruik gaan maken van een Online Support. Je gaat dan één dag online met de docent en je krijgt 1 op 1 maatwerk les. Al je problemen worden opgelost en je bent een flinke stap verder gekomen.

    Als je in de praktijk tegen problemen op loopt waar je zelf niet uit komt dan kun je 2 dingen doen. Je schrijft je in voor een basis of gevorderde cursus of je schrijft je in voor Online Support.

    Je gaat dan één dag online met een docent en je krijgt 1 op 1 maatwerk les. Al je problemen worden opgelost en je bent een flinke stap verder gekomen.

     

    Alle cursussen worden in contact les gegeven. De cursustijden zijn van 9.00 tot 16.00 uur. Voor koffie, thee, lunch en laptop wordt gezorgd. Online mee doen kan ook altijd. Je zit dan thuis op je eigen laptop en volgt de cursus in Google Meet mee. De lunch, koffie en thee moet je dan wel zorg voor zorgen.

    Je kunt per cursusdag beslissen of je naar onze locatie komt of dat je het online wil doen. Geef dit dan wel op tijd door aan de cursuscoördinator.

    Ja, dit doen we regelmatig. Onze docent komt dan naar uw locatie toe. Hij heeft laptops voor de cursisten bij zich. U hoeft alleen maar een lokaal bij u op locatie te regelen.

    U kunt uw wensen doormailen naar info@geo-ict.nl  dan mailen we u een offerte. Na opdrachtverlening neemt onze cursuscoördinator contact met u op om de lesdagen in te plannen.

    Na iedere cursus krijgen de cursisten een link naar ons evaluatieportaal. Daar kunt u melden wat je wel en niet goed vond aan de cursus. We doen altijd ons uiterste best maar toch kan het natuurlijk voorkomen dat u een klacht heeft. Klik op Klachtenregeling.  Daarin staat beschreven wat u kunt doen. Geo-ICT Training Center, Nederland is lid van de Nederlandse Raad voor Trainen en Opleiden ( NRTO ).

    Na de cursus mailen we u een link naar ons evaluatieportaal. Daar kun u inloggen en een evaluatieformulier in vullen en daar kunt u ook uw deelname certificaat downloaden.