آپاچی هدوپ (Apache Hadoop)

Data Node , Name Node , Job Tracker , Task Tracker

NAME NODE مقادیر متادیتا (تعداد بلاکها ، برروی کدام Rack و بروی کدام DATA NODE داده ها ذخیره می شوند ، ساختار پوشه ها و فایلها در HDFS و همچنین شامل خصوصیات آنها از قبیل مالکیتها ، مجوزها، محدودیتها می باشد) را ذخیره می کنند در صورتی که فقط داده ها روی DATA NODE ذخیره می شوند.

در یک هدوپ چند کلاستره (Multinode cluster) NAME NODE و DATA NODEها بر روی ماشینهای متفاوت فعالیت می کنند. در یک کلاستر، یک NAME NODE و تعداد زیادی DATA NODE وجود دارد به همین دلیل ما NAME NODE را تنها نودی می نامیم که سیستم را Fail می کند. اگرچه SECONDRY NAME NODE(SNN) وجود دارد که بروی ماشین جداگانه ای کار می کند و از Fail شدن سیستم جلوگیری می کند اما مشکل اینجاست که SNN در حقیقت دقیقا کار NAME NODE اصلی را انجام نمی دهد. در واقع SNN ، نسخه پشتیبان NAME NODE است و کار Image کردن و بازیابی اطلاعاتNAME NODE را بر عهده دارد.

در یک Single node cluster ، NAME NODE و DATA NODE قادرند بطور همزمان برروی یک ماشین کار می کنند.

Job Tracker یک Master است که Jobها را تولید و اجرا می کند. JOB TRACKER در NAME NODE اجرا می شود و اجازه می دهد که TASK TRACKER داخل DATA NODE اجرا شود. TASK TRACKER وظایف را اجرا می کند و وضعیت وظایف را به JOB TRACKER گزارش می دهد.

TASK TRACKER یک نود در کلاستر است که وظایفی از قبیل Map-Reduce و عملیات Shufle را از Job Tracker قبول می کند. هر TASK TRACKER با مجموعه ای از Slotها پیکربندی می شود. وقتی که JOB TRACKER سعی دارد که یک جا برای یک پردازش پیدا کند ابتدا در همان سرور که داده ها ذخیره شده اند جستجو می کند اگر چنین Slot وجود نداشت درSlot دیگر در همان Rack پردازش را ذخیره می کند.

TASK TRACKER وظایف را به صورت جداگانه بروی

ادامه مطالب

+ نوشته شده در یکشنبه نوزدهم مهر ۱۳۹۴ ساعت 11:44 توسط جمال مکتوبیان |

آپاچی هدوپ (Apache Hadoop)

Data Node , Name Node , Job Tracker , Task Tracker

نوشته‌های پیشین

آرشیو موضوعی

برچسب‌ها