• 055 844 42 20

Zoek in meer dan 200
Geo-informatie cursussen

Pyspark met apache

  • Omschrijving
  • Planning en Aanmelden

Deze tweedaagse cursus pyspark met Apache kost € 995,- . Apache Spark is een krachtige, open-source processing engine voor Big Data in het Hadoop cluster. Met Spark is het mogelijk om datasets die verschillen in aard en bron te verwerken. De grootste voordelen van Apache Spark zijn snelheid, gebruiksgemak, het combineren van SQL, streaming en complexe analyses en het feit data Spark overal kan draaien. Met de Python API kunnen er eenvoudig allerlei acties in Apache plaatsvinden. Enige kennis van python is gewenst maar niet vereist.

Inhoud

Allereerst zullen we ingaan op het installeren. Daarna wordt er een inleiding op het framework gegeven. Vervolgens leer je hoe je moet werken met RDDs en HDFS. We gaan ook in op parallel processing en het bouwen van Spark applicaties. Tenslotte leer je meer over Spark streaming, Spark algoritmen en verbeteren van prestaties van het framework. In deze Spark training / cursus leer je hoe je Spark applicaties met behulp van Python kan ontwikkelen. Zo leert je bijvoorbeeld hoe je Spark applicaties kan testen en deployen naar een cluster en hoe je deze clusters vervolgens kan monitoren.

Wat je leert deze cursus:

  • Na het volgen van deze training ben je bekend met de basis van Apache Spark.
  • RDDs, HDFS en Spark algoritmen.
  • Je snapt hoe parallel processing in zijn werk gaat en hoe je applicaties bouwt.
  • Hoe je de prestaties van Apache Spark verbetert en problemen detecteert.

PDF Icon

Deze pagina als PDF lezen? Klik dan op de knop hieronder.

Sluit Menu