Hadoop เป็นหนึ่งในเฟรมเวิร์กการเขียนโปรแกรมโอเพ่นซอร์สที่ทรงพลังที่สุด เป็นเครื่องมือสำคัญสำหรับทุกคนที่หวังจะหางาน Big Data หากคุณต้องการปัดฝุ่นทักษะ Hadoop ของคุณหรือเรียนรู้วิธีที่จะเชี่ยวชาญ ทางเลือกที่ดีที่สุดของคุณคือการเรียนหลักสูตรออนไลน์ หากไม่สามารถใช้ได้ ให้ดูบทแนะนำออนไลน์ฟรีและใช้เอกสารอ้างอิงเพื่อแก้ไขปัญหาเฉพาะ เมื่อคุณมีพื้นฐานแล้ว ให้ฝึกฝนชุดข้อมูลจริงขนาดเล็กเพื่อพัฒนาทักษะของคุณ
ขั้นตอน
วิธีที่ 1 จาก 2: การเรียนหลักสูตรและการใช้บทช่วยสอน
ขั้นตอนที่ 1 ลงทะเบียน Cloudera สำหรับหลักสูตร 6 ส่วนและบทช่วยสอนแบบโต้ตอบ
Cloudera ให้ตัวอย่างในโลกแห่งความเป็นจริงแก่คุณเพื่อฝึกฝนในสภาพแวดล้อมแบบอ่านอย่างเดียว คุณจึงไม่ต้องกังวลกับการทำผิดพลาดครั้งใหญ่ พวกเขายังเสนอเครื่องมือวิเคราะห์เพื่อช่วยคุณทดสอบการสืบค้นข้อมูล รวมถึงการสาธิตสดฟรีที่เรียกว่า Cloudera Live เพื่อช่วยให้คุณเรียนรู้สภาพแวดล้อม Hadoop
แม้ว่าหลักสูตรเชิงลึกที่สมบูรณ์พร้อมใบรับรองจะมีค่าใช้จ่าย $295 แต่จะคุ้มค่าแน่นอนหากคุณใช้ทักษะเหล่านี้กับงานของคุณ การใช้หลักสูตร Cloudera จะช่วยให้คุณจับข้อผิดพลาดและประหยัดเวลา ซึ่งจะทำให้ชำระเงินเองได้อย่างรวดเร็ว
ขั้นตอนที่ 2 ลองหลักสูตรออนไลน์ฟรีผ่าน Cloudera หากคุณรู้พื้นฐานอยู่แล้ว
หากคุณมีประสบการณ์กับ Hadoop และต้องการทบทวนอีกครั้ง คุณอาจไม่ต้องเสียเงินสำหรับหลักสูตร 6 ส่วน ให้ตรวจสอบหลักสูตรออนไลน์ฟรีบนเว็บไซต์ Cloudera University แทน
มีแหล่งข้อมูลสำหรับผู้ดูแลระบบ นักพัฒนา และนักวิเคราะห์ข้อมูล ดังนั้นไม่ว่าคุณจะมีบทบาทอะไร คุณควรจะสามารถหาหลักสูตรที่เหมาะสมได้
ขั้นตอนที่ 3 เข้าเรียนหลักสูตรระดับมหาวิทยาลัยใน Coursera หากคุณต้องการทฤษฎีเพิ่มเติม
Coursera เป็นแหล่งหลักสูตรการเขียนโปรแกรมที่มีชื่อเสียงและเป็นที่ยอมรับ แม้ว่าโดยทั่วไปคำแนะนำจะเป็นแบบทฤษฎีมากกว่าและไม่ได้รวมตัวอย่างการทำงานจำนวนมาก แต่คุณสามารถฝึกฝนควบคู่ไปกับบทช่วยสอนและใช้โครงงานของหลักสูตรเพื่อรับประสบการณ์จริง
- คุณสามารถค้นหาหลักสูตรนี้ทางออนไลน์ได้ที่
- ค่าใช้จ่ายจะแตกต่างกันไปในแต่ละหลักสูตร แต่ Coursera ยังเสนอตัวเลือกความช่วยเหลือทางการเงินแก่ผู้ที่มีคุณสมบัติ
ขั้นตอนที่ 4 ทำตามหลักสูตรฟรีที่ Big Data University สำหรับตัวเลือกที่คุ้มค่า
หากคุณไม่ต้องการจ่ายค่าคอร์สออนไลน์ Big Data University ก็เป็นตัวเลือกที่ดี พวกเขามีหลักสูตร 2 ส่วน ซึ่งเน้นที่พื้นฐานของ Hadoop ก่อน จากนั้นจึงเขียนโปรแกรมด้วย Hadoop และรูปแบบออนไลน์ช่วยให้คุณดำเนินการตามต้องการได้อย่างง่ายดาย
- คุณสามารถค้นหาหลักสูตรเหล่านี้ได้ที่
- พวกเขามีบทช่วยสอนมากมายในภาษาอังกฤษ รวมทั้งภาษาญี่ปุ่น สเปน โปรตุเกส และรัสเซีย
ขั้นตอนที่ 5. ค้นหาคำแนะนำแบบเจาะจงบน YouTube หากคุณต้องการการฝึกอบรมเฉพาะเจาะจงฟรี
มีวิดีโอนับพันที่ทำขึ้นเพื่ออธิบาย Hadoop และวิธีใช้งาน วิดีโอที่หลากหลายให้ความยืดหยุ่นแก่คุณ แถมยังฟรีอีกด้วย หากคุณพบปัญหาใดโดยเฉพาะ ให้ค้นหาวิดีโอบน YouTube ที่จะแนะนำคุณตลอดกระบวนการ
บทแนะนำเกี่ยวกับ Hadoop ควรหาได้ง่ายพอสมควร เนื่องจาก "hadoop" เป็นข้อความค้นหาที่ไม่ซ้ำใคร
ขั้นตอนที่ 6 ใช้บทช่วยสอนฟรีของ Yahoo หากคุณต้องการฝึกฝนด้วยตัวอย่างเสมือนจริง
บทแนะนำเหล่านี้แบ่งออกเป็น 7 โมดูล และจะแนะนำคุณเกี่ยวกับการติดตั้งและใช้งาน Hadoop ตั้งแต่เริ่มต้น นี่เป็นตัวเลือกที่ยอดเยี่ยมสำหรับการปัดฝุ่นทักษะเฉพาะหากมันขึ้นสนิมเล็กน้อย
ขั้นตอนที่ 7 อ้างถึงเอกสาร IBM Open Source สำหรับคำแนะนำเชิงลึกฟรี
นี่เป็นเอกสาร PDF แบบโอเพ่นซอร์สที่ละเอียดอย่างเหลือเชื่อซึ่งสร้างขึ้นโดยโครงการฝึกอบรมของ IBM มันจะแนะนำคุณเกี่ยวกับ Hadoop อย่างระมัดระวัง ทีละขั้นตอน และให้คำแนะนำเป็นลายลักษณ์อักษรที่ชัดเจน
คำแนะนำเหล่านี้ยังใช้ได้ดีเมื่อจับคู่กับการสาธิตสดอย่าง Cloudera
วิธีที่ 2 จาก 2: การเปลี่ยนไปใช้แอปพลิเคชันในโลกแห่งความเป็นจริง
ขั้นตอนที่ 1 ถามว่าคุณสามารถใช้ Hadoop ในที่ทำงานเพื่อฝึกฝนกับข้อมูลจริงได้หรือไม่
ยื่นคำร้องกับหัวหน้าหรือหัวหน้างานของคุณ หรือพูดคุยกับพวกเขาแบบตัวต่อตัวเกี่ยวกับการนำทักษะใหม่เหล่านี้มาสู่ที่ทำงาน นี่เป็นสิ่งสำคัญอย่างยิ่งหากบริษัทของคุณจ่ายค่าฝึกอบรมหรือหลักสูตรออนไลน์ใดๆ
ยิ่งคุณเริ่มใช้ทักษะที่เรียนรู้ได้เร็วเท่าไหร่ คุณก็จะเชี่ยวชาญได้เร็วเท่านั้น
ขั้นตอนที่ 2 มองหาโครงการง่ายๆ เพื่อฝึกฝนทักษะของคุณ
เลือกโครงการที่ค่อนข้างง่ายและมีความเสี่ยงต่ำ เช่น การนับและจัดอันดับจำนวนการโต้ตอบต่อตัวแทนลูกค้า เช่น อีเมลและเซสชันการแชท
- แอปพลิเคชั่นข้อมูลจริงอื่น ๆ บางตัวรวมถึงการสแกนผ่านเว็บบล็อกเพื่อหาข้อผิดพลาดหรือตรวจสอบช่องทางโซเชียลมีเดียสำหรับความเชื่อมั่นของแบรนด์
- คุณยังสามารถฝึกใช้ข้อมูลตัวอย่างจากไซต์ต่างๆ เช่น https://www.kaggle.com/datasets หรือ
ขั้นตอนที่ 3 ตรวจสอบโค้ดของคุณเป็นประจำด้วยชุดย่อยเล็กๆ เพื่อหาจุดบกพร่อง
ก่อนเรียกใช้ชุดข้อมูลทั้งหมด ให้นำชุดข้อมูลทดสอบที่มีขนาดเล็กลงในเครื่องท้องถิ่นของคุณและเรียกใช้ผ่านโหมดต่างๆ ที่หลากหลาย ตัวอย่างเช่น คุณสามารถเรียกใช้ซ้ำๆ ผ่านโหมด Local Jobrunner จากนั้น โหมด Pseudo-Distributed และโหมด Fully-Distributed
- วิธีนี้จะช่วยให้คุณทราบข้อบกพร่องหรือข้อบกพร่องก่อนที่จะขยายในชุดข้อมูลทั้งหมด
- โหมด Local Jobrunner ช่วยให้คุณทดสอบและแก้ไขจุดบกพร่องของแผนที่และโค้ดลดได้ในเครื่อง โหมด Pseudo-Distributed จะเลียนแบบสภาพแวดล้อมการผลิต และโหมด Fully-Distributed จะตรวจสอบคลัสเตอร์การผลิตจริงของคุณ
ขั้นตอนที่ 4 ใช้การทดลองใช้ฟรี 1 ปีเพื่อฝึกฝนในสภาพแวดล้อมเครื่องเสมือน
บริษัทต่างๆ เช่น Amazon และ Microsoft เสนอการสมัครสมาชิกแบบชำระเงินสำหรับบริการฝึกปฏิบัติ Hadoop เครื่องเสมือนของ Amazon เรียกว่า Amazon Web Service (AWS) และบริการของ Microsoft เรียกว่า Microsoft Azure สำหรับทั้งสองบริการ ปีแรกของคุณจะไม่มีค่าใช้จ่ายเมื่อคุณป้อนข้อมูลบัตรเครดิต
อย่าลืมยกเลิกการสมัครหลังจาก 1 ปีเพื่อหลีกเลี่ยงการถูกเรียกเก็บเงิน
เคล็ดลับ
- โปรดทราบว่า Hadoop เป็นภาษาโปรแกรมเฉพาะทางที่แคบกว่า แน่นอนว่ามันจะทำให้คุณได้เปรียบในโลกของข้อมูลขนาดใหญ่ แต่ไม่จำเป็นต้องเป็นโปรแกรมเมอร์เสมอไป
- คุณยังสามารถอ่านหนังสือและบทความเกี่ยวกับ Hadoop เช่น Hadoop:The Definitive Guide ฉบับที่ 3 โดย Tom White