|
讲座介绍:
当前大数据架构最火热的莫过于分布式计算架构Hadoop和流数据处理框架Spark/Storm这两类。Hadoop是一个对海量数据进行处理的分布式系统架构。由于Hadoop的计算过程放在硬盘,数据的吞吐和处理速度不如使用内存快,流数据处理框架Spark和Storm开始登上舞台。
未来技术趋势何去何从?
网上逐渐有一种声音说Hadoop的日子已经快到头了。真的是真的吗?未来大数据架构究竟该走向何方呢? 本次讲座将从大数据架构变迁出发,深入浅出讲解Hadoop及Spark技术架构,优劣对比,并探讨未来大数据架构将走向何方。
特邀嘉宾:
分布式存储系统方向博士,毕业前主要研究如何提高大数据(分布式)存储系统的可靠性,可扩展性和节能。现在主要负责针对对各种大数据平台系统的评测,开发,部署以及大数据应用的开发。
讲座目录:
Hadoop
Hadoop简介
当前Hadoop生态系统
Hadoop架构概览
MapReduce的瓶颈
Spark
Spark简介
Spark架构概览
Hadoop vs Spark
批处理与流处理适用问题
两种技术优劣对比
实例Demo
大数据框架探讨
业界实践探讨
未来趋势探讨
讲座时间:
北京时间6月08日(周四)10AM
|
|