خطای 101 و 102 در سرورهای HPE به چه معنا است؟

سرورهای HPE متعلق به کمپانی محبوب Hewlett Packard Enterprise که در مراکز داده و محیط‌های سازمانی استفاده می‌شوند مانند هر سیستم پیچیده‌ای، با خطاهایی روبرو هستند که بر عملکرد و امنیت داده‌ها تأثیر می‌گذارد. اغلب خطای رایج سرورها مربوط به RAID، فریمور، منبع تغذیه و اجزای سخت‌افزاری است. در این مقاله همراه ما باشید تا دو نوع از خطاهای عددی رایج به‌نام خطای ۱۰۱ و خطای ۱۰۲  را بررسی کنیم. انواع و نحوه برطرف کردن این خطاها نیز مدنظر است.

خطای ۱۰۱ سرور HPE

 

خطای ۱۰۱ در سرورهای HPE معمولاً نشان‌دهنده خطای ROM در طول فرآیند راه‌اندازی سرور است. این خطا ممکن است به‌دلایل مختلفی رخ دهد مانند مشکل در حافظه یا DIMM، سیستم‌عامل خراب یا قدیمی، مشکلات سخت‌افزاری یا پیکربندی نادرست. 

خطای ۱۰۱ نشان می‌دهد سرور قادر به بارگذاری اطلاعات فریمور یا پیکربندی لازم از ROM نیست و از بالا آمدن صحیح آن جلوگیری می‌کند. این خطا یک مشکل حیاتی است، زیرا باعث از کارافتادن عملکردهای مدنظر سرور و در نهایت از دست‌رفتن داده یا خرابی آنها می‌شود. بنابراین، ضروری است در اسرع وقت از طریق عیب‌یابی و پشتیبانی مناسب آن را برطرف کنید. با توجه به مدل سرور HPE و نسخه فریمور، ممکن است پیام خطا به‌شکل‌های مختلفی نمایش داده شود. 

برای عیب‌یابی این خطا می‌توانید مراحل زیر را امتحان کنید:

  • گزارش‌ یا ریپورت‌های سرور را برای هرگونه اطلاعات اضافی در مورد خطا بررسی کنید.
  • بایوس سرور را به تنظیمات پیش‌فرض برگردانید و سعی کنید دوباره بوت شود.
  • فریمور سرور را به آخرین نسخه به‌روزرسانی کنید.
  • اجزای سخت‌افزاری مانند ماژول‌های RAM را برای علائم آسیب یا خرابی بررسی کنید.
  • با استفاده از ابزارهای تشخیصی، DIMM های معیوب را تنظیم یا جایگزین کنید.
  • از صحت تنظیمات پیکربندی سرور مطابق با استفاده مدنظر خود مطمئن شوید.

همانطور که در بالا ملاحظه کردید خطای ۱۰۱ به‌دلایل مختلفی ظاهر می‌شود. در ادامه انواع این خطا و نحوه رفع آنها را بررسی می‌کنیم. 

خطای ۱۰۱–ROM Error

در سرور HPE، خطای ۱۰۱-ROM بیانگر وجود مشکل درROM سرور است. ROM یک مؤلفه/ جزء فریمور (firmware ) حاوی کد اصلی سیستم ورودی/خروجی (BIOS) است که اجزای سخت‌افزاری سرور را در طول فرآیند بوت، مقداردهی اولیه (initializes) و کنترل می‌کند. اگر در سرور HPE با خطای ۱۰۱-ROM مواجه شدید، چندین مرحله برای حل این مشکل وجود دارد:

  • برق سرور را بررسی کنید و از درستی و امنیت همه کابل‌ها و اتصالات مطمئن شوید.
  • نسخه فریمور سرور را بررسی کنید و آن را با آخرین نسخه موجود در وب سایت HPE مقایسه کنید. اگر فریمور قدیمی است، آخرین نسخه را دانلود و نصب کنید تا ROM سیستم آپدیت شود.
  • بایوس سرور را به تنظیمات پیش‌فرض خود برگردانید. این کار را می‌توانید با ورود به بخش تنظیمات BIOS در هنگام بوت و انتخاب گزینه “Reset to Defaults” انجام دهید.
  • اگر مشکل همچنان ادامه داشت، سعی کنید اجزای سخت‌افزاری غیرضروری مانند کارت‌های توسعه یا دستگاه‌های ذخیره‌سازی را از سرور حذف کنید و سپس سرور را دوباره روشن کنید.

توجه به این نکته ضروری است که تغییر ROM در سرور HPE فقط باید توسط متخصصان IT با‌تجربه انجام شود، زیرا به‌روز‌رسانی یا تغییرات نامناسب فریمور باعث مشکلات جدی سیستم یا حتی از دست‌رفتن اطلاعات می‌شود.

برای موارد بالا و بررسی عمیق‌تر از Insight Diagnostics استفاده کنید. یک ابزار نرم‌افزاری ارائه‌شده توسط HPE است که برای تشخیص و عیب‌یابی مشکلات سخت‌افزاری سرورهای HPE، از جمله خطاهای ۱۰۱-ROM استفاده می‌شود. از آنجایی که این ابزار برای ارائه اطلاعات دقیق در مورد سخت‌افزار سرور طراحی شده است، می‌تواند در شناسایی مشکلات احتمالی این اجزا کمک کند. با پیام‌های خطا و گزارش‌های دقیقی که Insight Diagnostics ارائه می‌دهد، می‌توان جزء سخت‌افزاری خاصی که باعث خطا شده است را شناسایی کرد. 

Insight Diagnostics را می‌توان مستقیماً از فریمور سرور اجرا کرد یا آن را از طریق درایو USB یا CD قابل‌بوت نصب و اجرا کرد. این ابزار بسیار کاربرپسند است و دستورالعمل‌های گام‌به‌گام برای اجرای تست‌ها و تفسیر نتایج را ارائه می‌دهد. استفاده از Insight Diagnostics به متخصصان فناوری اطلاعات کمک می‌کند تا به‌سرعت مشکلات سخت‌افزاری سرورهای HPE، از جمله خطاهای ۱۰۱-ROM را با حداقل خرابی و از دست رفتن داده‌ها یا سایر مشکلات سیستم، شناسایی و حل کنند.

خطای Error 101-I/O ROM 

خطای Error 101-I/O ROM در سرور HPE معمولاً به‌دلیل وجود مشکل در قسمت ورودی/خروجی (I/O) فریمور ROM است. خرابی Option ROM در دستگاه‌های PCI، PCI-X یا PCI Express می‌تواند باعث خطای ROM 101-I/O در سرور شود. Option ROM یک فریمور است که در کارت‌های توسعه تعبیه شده و مقداردهی اولیه و پیکربندی دستگاه‌ها را در طول فرآیند بوت انجام می‌دهد. اگر Option ROM از کار بیفتد یا خراب شود، از تنظیم اولیه درست دستگاه جلوگیری می‌کند که به‌نوبه خود باعث خرابی در قسمت ورودی/خروجی فریمورو خطای ROM 101-I/O می‌شود.

برای عیب‌یابی این خطا موارد زیر پیشنهاد می‌شود:

  • فریمور سرور را به آخرین نسخه به‌روزرسانی کنید.
  •  کابل‌های شل یا آسیب‌دیده را بررسی کنید.
  • کارت‌های توسعه ورودی/خروجی را دوباره نصب کنید.
  • قطعه سخت‌افزاری معیوب را جایگزین کنید.
  • تداخل با سایر دستگاه‌ها یا پیکربندی‌هایی که می‌تواند باعث از کار افتادن Option ROM شود، را بررسی کنید.
  • Option ROM دستگاه را به‌روزرسانی کنید.

خطای System 101-Option ROM Checksum Error

مشاهده خطای System 101-Option ROM Checksum در سرورهای HPE بیانگر وجود مشکل در فریمور سرور است و به‌طور خاص، نشان می‌دهد که فریمور (همچنین به‌نام Option ROM) در تست Checksum موفق نبوده. 

Checksum تست، الگوریتمی است که برای تأیید صحت داده‌ها، در این مورد فریمور، استفاده می‌شود. تست Checksum خرابی یا تغییر داده‌ها را بررسی می‌کند. فریموربه‌دلایل مختلفی مانند فریمورمعیوب، فلش فریمور خراب، یا مشکلات سخت‌افزاری مربوط به expansion board یا حافظه و بایوس ممکن است در تست Checksum رد شود.

برای رفع این مشکل گاهی اوقات لازم است موارد زیر را انجام دهید:

  • تنظیمات بایوس سرور را به‌حالت پیش‌فرض خود برگردانید.( با فشار دادن کلید F2 یا Del می‌توانید این کار را انجام دهید).
  • Option ROM را با نسخه جدید فریمور دوباره فلش کنید. 
  • فریمور سرور را به‌روزرسانی کنید.
  • قطعه سخت‌افزاری معیوب را جایگزین کنید.
  • expansion board را دوباره نصب کنید.

expansion board که به‌عنوان کارت‌های افزودنی (add-in cards) نیز شناخته می‌شود، دستگاهی است که در اسلات‌های PCIe سرور قرار می‌گیرد تا عملکردهای اضافی مانند رابط‌های اضافی شبکه، کنترلرهای ذخیره‌سازی یا کارت‌های گرافیک را ارائه دهد. اگر این قطعه دارای فریمور یا Option ROM خود باشد باید با فریمور سرور سازگار باشد. در صورتی که با فریمور سرور سازگار نباشد و یا در صورت وجود ایراد، به‌طور بالقوه باعث ایجاد خطای System 101-Option ROM Checksum در سرور می‌شود. همچنین، Option ROM معیوب نیز باعث این خطا می‌شود. برای رفع خطا بهتر است expansion board را حذف کرده و سرور را مجددا راه اندازی کنید تا ببینید آیا خطا ادامه دارد یا خیر. 

اگر پس از برداشتن expansion board، خطا برطرف نشد و هیچ یک از موارد بالا مشکل را برطرف نکرد، ممکن است لازم باشد تراشه Option ROM یا کل مادربرد را تعویض کنید. در این مورد، بهتر است از یک متخصص سرور یا تیم پشتیبانی فنی کمک بگیرید. 

خطای ۱۰۲ سرور HPE

 

خطای ۱۰۲ یک کد سخت‌افزاری است که نشان می‌دهد در برد سیستم یا مادربرد سرور به‌دلایل مختلفی مانند قطعات معیوب، پیکربندی نادرست یا مشکلات الکتریکی خطایی رخ داده است.

خطای ۱۰۲ به چهار صورت ظاهر می‌شود. که در ادامه به آنها اشاره می‌کنیم. توجه داشته باشید که برای رفع و عیب‌یابی این خطاها ابتدا مطمئن شوید که سرور HPE شما بر روی آخرین نسخه نرم‌افزاری و فریمور اجرا می‌شود و طبق دستورالعمل‌های سازنده پیکربندی شده است. اگر مشکل حتی پس از انجام مراحل عیب‌یابی توصیه‌شده همچنان ادامه داشت، باید برای راهنمایی بیشتر با پشتیبانی فنی و متخصصین سرورهای HPE تماس بگیرید.

خطای ۱۰۲-System Board Failure

خطای “۱۰۲-System Board Failure” در سرور HPE معمولاً نشان‌دهنده یک مشکل در برد سیستم است که به‌عنوان مادربرد نیز شناخته می‌شود. ایرادات تایمرهای ۸۲۵۴ و کنترلر DMA 8237 نیز اغلب باعث این خطا می‌شود.

برد سیستم، برد مدار اصلی در سرور است که تمام اجزای دیگر مانند CPU، RAM و دستگاه‌های ذخیره‌سازی را به هم متصل می‌کند. این پیام خطا نشان می‌دهد که یک مشکل سخت‌افزاری در برد سیستم وجود دارد که منجر به مشکلات مختلفی مانند ناپایداری سیستم، از دست دادن داده‌ها یا حتی خرابی کامل سیستم می‌شود. گاهی علت خاص این خطا به‌دلیل مشکلاتی مانند مدار آسیب‌دیده، قطعه خراب یا فریمور معیوب است.

برای رفع این مشکل می‌توانید مراحل زیر را امتحان کنید:

  • کابل‌ها یا اجزای شل یا جدا شده‌ای که ممکن است باعث این مشکل شوند را بررسی کنید.
  • اجزای قابل جابه‌جایی مانند ماژول‌های RAM یا کارت‌های توسعه را مجدداً قرار دهید تا مطمئن شوید که درست به برد سیستم متصل شده‌اند.
  • فریمور و درایورهای سرور را به‌روزرسانی کنید، زیرا نرم‌افزار قدیمی یا خراب می‌تواند باعث خرابی برد سیستم شود.

اگر هیچ یک از مراحل بالا مشکل را حل نکرد، ممکن است برای رفع مشکل نیاز به تعویض برد سیستم داشته باشید. توجه کنید از آنجایی که تلاش برای تشخیص یا رفع مشکلات سخت‌افزاری در سرور پیچیده و بالقوه خطرناک است بهتر است با یک متخصص واجد شرایط یا تیم پشتیبانی ماهر در تماس باشید. 

خطای ۱۰۲-System Board Failure, CMOS Test Failed

کد خطا “۱۰۲-System Failure, CMOS Test Failed” در سرورهای بیانگر مشکل در پیکربندی (CMOS) سیستم است.

CMOS یا (Complementary Metal-Oxide-Semiconductor) مقداری از حافظه در برد سیستم است که تنظیمات BIOS و پیکربندی‌های سیستم مانند تاریخ و زمان، ترتیب راه‌اندازی و تنظیمات سخت‌افزاری را ذخیره می‌کند. 

تست CMOS یک تست تشخیصی است که یکپارچگی حافظه CMOS و توانایی آن در حفظ تنظیمات را بررسی می‌کند. اگر تست CMOS ناموفق باشد، به این معنی است که برد سیستم نمی‌تواند به‌درستی این داده‌ها را ذخیره یا به آنها دسترسی داشته باشد. پس حافظه CMOS خراب شده است، یا مشکلی در خود برد سیستم وجود دارد، مانند خراب شدن DMA controllers یا timers و یا قطعات مشابه آن‌ها.

بنابراین این خطا به‌دلایل مختلف زیر ممکن است بروز کند:

  •  باتری CMOS کارآمدی خود را از دست داده است.
  •  پیکربندی CMOS نادرست است. 
  •  اجزای برد معیوب شده است. 

برای رفع این خطا، ممکن است نیاز به تعویض برد سیستم یا هر قطعه معیوب داشته باشید. با این حال، قبل از انجام این کار، می‌توانید با پاک کردن CMOS، حافظه آن را به تنظیمات پیش‌فرض برگردانید. این کار را با خارج کردن باتری CMOS یا با استفاده از جامپر CMOS روی برد سیستم انجام دهید. توجه کنید که جداسازی برد نیاز به تخصص و مهارت کافی دارد و نباید سرخود کاری انجام داد. برای تعویض برد سیستم و اجرای server setup utility حتما از متخصصین مربوطه کمک بگیرید. 

خطای ۱۰۲-System Board Failure, DMA Test Failed

بروز این خطا در سرورهای HPE نشان‌دهنده مشکل در کنترلر (DMA) روی برد سیستم است. DMA یک ویژگی سخت‌افزاری است که به دستگاه‌ها اجازه می‌دهد داده‌ها را مستقیماً به و از حافظه بدون دخالت CPU منتقل کنند.

هنگامی که تست DMA با شکست مواجه می‌شود، به این معنی است که کنترلر به‌درستی کار نمی‌کند و ممکن است باعث ایجاد مشکلاتی در انتقال داده یا سایر عملیات سیستم شود. 

تراشه DMA معیوب، قطعات آسیب‌دیده برد سیستم یا سایر مشکلات مربوط به سخت‌افزار همگی باعث بروز خطای System Board Failure, DMA Test Failed می‌شود.

اگر در سرور HPE با این خطا مواجه شدید، توصیه می‌شود برای راهنمایی و پشتیبانی فنی با متخصصین در ارتباط باشید. ممکن است در صورت لزوم تعویض برد سیستم یا سایر اجزا نیاز باشد.

خطای ۱۰۲ -System Board Failure, Timer Test Failed

این پیغام خطا بیانگر یک مشکل سخت‌افزاری با برد سیستم در سرور است و می‌تواند ناشی از تراشه تایمر معیوب یا سایر قطعات سخت‌افزاری روی مادربرد باشد.

موارد زیر برای عیب‌یابی این مشکل توصیه می‌شود:

  • تمام گزارش‌های سرور در مورد هرگونه پیام خطا یا سرنخ‌هایی که ممکن است باعث ایجاد مشکل شده باشد، را بررسی کنید.
  • همه اجزاء از جمله کارت‌های توسعه، ماژول‌های حافظه و کابل‌ها را ریست کنید.
  • فریمور و درایورهای برد سرور و سایر اجزای سخت‌افزاری را به‌روز کنید.

اگر مشکل برطرف نشد، ممکن است لازم باشد برد سیستم را تعویض کنید.

جمع‌بندی

 

در این مقاله دو نوع از خطاهای عددی سرورهای HPE به‌نام خطای ۱۰۱ و ۱۰۲ را بررسی کردیم. خطای ۱۰۱ بیانگر وجود مشکل در بارگذاری اطلاعات فریمور است که در نهایت از بالا آمدن صحیح آن جلوگیری می‌کند. در حالیکه خطای ۱۰۲ یک کد سخت‌افزاری است که نشان می‌دهد در مادربرد سرور خطایی رخ داده است. توجه به این نکته ضروری است که کار بر روی سخت‌افزار سرور نیاز به مهارت و دانش تخصصی دارد، بنابراین انجام هیچ گونه تعمیری توصیه نمی‌شود مگر اینکه تخصص لازم را داشته باشید. خواندن مستندات شرکت‌سازنده سرور و کمک گرفتن از افراد و شرکت‌های تخصصی مانند مشاوران ارمغان اشراق در هنگام خرید سرورهای HPE، بهترین راه برای مقابله با مشکلات احتمالی است.

اگر برای عیب‌یابی خطاها راه‌حل‌هایی به ذهنتان می‌رسد بسیار خرسند خواهیم شد آن را در بخش کامنت‌ها با ما به‌اشتراک بگذارید.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

Verified by MonsterInsights