12342378_1172027489493793_2369748273182220796_n

12359912_1172027469493795_6696532846100447831_n

Hadoop คือ platform สำหรับมำการจัดเก็บ และ ประมวลผลข้อมูลขนาดใหญ่ (Big Data) ซึ่งสามารถรองรับการขยายตัวของข้อมูล และ มีความน่าเชื่อถือสูง เนื่องจากสามารถทำการประมวลผลแบบกระจาย โดยผ่านเครื่อง computer มากมายที่อยู่ใน cluster ได้ง่าย
Hadoop ถูกสร้างขึ้นมาเพื่อให้สามารถขยายระบบด้วยการเพิ่มเครื่อง computer เป็นหลักร้อยหลักพัน มากกว่าการขยายเครื่องเดียวให้มีประสิทธิภาพที่สูงขึ้น รวมทั้งมีระบบตรวจจับข้อผิดพลาดจากการทำงาน และสามารถจัดการความผิดพลาดเหล่านั้นได้ ทำให้ระบบมีความน่าเชื่อถือในระดับสูง
Hadoop มีส่วนการทำงานหลัก 3 ส่วน คือ
– Cluster management
– Storage
– Processing
Refer: http://www.somkiat.cc/start-with-hadoop/