Tag Archives: DataFrame

Was ist der Unterschied zwischen RDD, DataFrame und Dataset in Apache Spark?

Apache Spark wurde entwickelt, um eine höhere Leistung im Hadoop-Ökosystem erreichen zu können. Im Vergleich zu Hadoop soll Spark dank In-Memory-Berechnungen und weiterer Optimierungen bei der Datenverarbeitung wesentlich schneller sein. In diesem Blog will ich erklären, welche Datenstrukturen Spark mitbringt und … Continue reading

Posted in Java Runtimes - VM, Appserver & Cloud | Tagged , , , | Leave a comment