sparkSpark is a cluster computing system. It is faster as compared to other cluster computing systems (such as Hadoop). It provides hh-level APIs in Python, Scala, and Java. Parallel jobs are easy to write in Spark.Apache Spark adalah mesin pemrosesan data sumber terbuka untuk kumpulan data besar, yang dirancang untuk memberikan kecepatan, skalabilitas, dan kemampuan pemrograman yang