Apache Spark is playing a critical role in the adoption and evolution of Big Data technologies because it provides sophisticated ways for enterprises to leverage Big Data compared to Hadoop. The increasing amounts of data being analyzed and processed through the framework is massive and continues to push the boundaries of the engine. Drawing on experiences across dozens of production deployments, Pepperdata Field Engineer Alexander Pierce explores issues observed in a cluster environment with Apache Spark and offers guidelines on how to avoid common mistakes. Attendees can use these observations to improve the usability and supportability of Spark and avoid such issues in their projects. Topics include: – Serialization – Partition sizes – Executor resource sizing – DAG management – Shading

Hora

19:00 - 20:00 hs GMT+1

Organizador

Pepperdata
Compartir
Enviar a un amigo
Mi email *
Email destinatario *
Comentario *
Repite estos números *
Control de seguridad
Junio / 2019 692 webinars
Lunes
Martes
Miércoles
Jueves
Viernes
Sábado
Domingo
Lun 27 de Junio de 2019
Mar 28 de Junio de 2019
Mié 29 de Junio de 2019
Jue 30 de Junio de 2019
Vie 31 de Junio de 2019
Sáb 01 de Junio de 2019
Dom 02 de Junio de 2019
Lun 03 de Junio de 2019
Mar 04 de Junio de 2019
Mié 05 de Junio de 2019
Jue 06 de Junio de 2019
Vie 07 de Junio de 2019
Sáb 08 de Junio de 2019
Dom 09 de Junio de 2019
Lun 10 de Junio de 2019
Mar 11 de Junio de 2019
Mié 12 de Junio de 2019
Jue 13 de Junio de 2019
Vie 14 de Junio de 2019
Sáb 15 de Junio de 2019
Dom 16 de Junio de 2019
Lun 17 de Junio de 2019
Mar 18 de Junio de 2019
Mié 19 de Junio de 2019
Jue 20 de Junio de 2019