سرورهای HPE متعلق به کمپانی محبوب Hewlett Packard Enterprise که در مراکز داده و محیطهای سازمانی استفاده میشوند مانند هر سیستم پیچیدهای، با خطاهایی روبرو هستند که بر عملکرد و امنیت دادهها تأثیر میگذارد. اغلب خطای رایج سرورها مربوط به RAID، فریمور، منبع تغذیه و اجزای سختافزاری است. در این مقاله همراه ما باشید تا دو نوع از خطاهای عددی رایج بهنام خطای ۱۰۱ و خطای ۱۰۲ را بررسی کنیم. انواع و نحوه برطرف کردن این خطاها نیز مدنظر است.
خطای ۱۰۱ سرور HPE
خطای ۱۰۱ در سرورهای HPE معمولاً نشاندهنده خطای ROM در طول فرآیند راهاندازی سرور است. این خطا ممکن است بهدلایل مختلفی رخ دهد مانند مشکل در حافظه یا DIMM، سیستمعامل خراب یا قدیمی، مشکلات سختافزاری یا پیکربندی نادرست.
خطای ۱۰۱ نشان میدهد سرور قادر به بارگذاری اطلاعات فریمور یا پیکربندی لازم از ROM نیست و از بالا آمدن صحیح آن جلوگیری میکند. این خطا یک مشکل حیاتی است، زیرا باعث از کارافتادن عملکردهای مدنظر سرور و در نهایت از دسترفتن داده یا خرابی آنها میشود. بنابراین، ضروری است در اسرع وقت از طریق عیبیابی و پشتیبانی مناسب آن را برطرف کنید. با توجه به مدل سرور HPE و نسخه فریمور، ممکن است پیام خطا بهشکلهای مختلفی نمایش داده شود.
برای عیبیابی این خطا میتوانید مراحل زیر را امتحان کنید:
- گزارش یا ریپورتهای سرور را برای هرگونه اطلاعات اضافی در مورد خطا بررسی کنید.
- بایوس سرور را به تنظیمات پیشفرض برگردانید و سعی کنید دوباره بوت شود.
- فریمور سرور را به آخرین نسخه بهروزرسانی کنید.
- اجزای سختافزاری مانند ماژولهای RAM را برای علائم آسیب یا خرابی بررسی کنید.
- با استفاده از ابزارهای تشخیصی، DIMM های معیوب را تنظیم یا جایگزین کنید.
- از صحت تنظیمات پیکربندی سرور مطابق با استفاده مدنظر خود مطمئن شوید.
همانطور که در بالا ملاحظه کردید خطای ۱۰۱ بهدلایل مختلفی ظاهر میشود. در ادامه انواع این خطا و نحوه رفع آنها را بررسی میکنیم.
خطای ۱۰۱–ROM Error
در سرور HPE، خطای ۱۰۱-ROM بیانگر وجود مشکل درROM سرور است. ROM یک مؤلفه/ جزء فریمور (firmware ) حاوی کد اصلی سیستم ورودی/خروجی (BIOS) است که اجزای سختافزاری سرور را در طول فرآیند بوت، مقداردهی اولیه (initializes) و کنترل میکند. اگر در سرور HPE با خطای ۱۰۱-ROM مواجه شدید، چندین مرحله برای حل این مشکل وجود دارد:
- برق سرور را بررسی کنید و از درستی و امنیت همه کابلها و اتصالات مطمئن شوید.
- نسخه فریمور سرور را بررسی کنید و آن را با آخرین نسخه موجود در وب سایت HPE مقایسه کنید. اگر فریمور قدیمی است، آخرین نسخه را دانلود و نصب کنید تا ROM سیستم آپدیت شود.
- بایوس سرور را به تنظیمات پیشفرض خود برگردانید. این کار را میتوانید با ورود به بخش تنظیمات BIOS در هنگام بوت و انتخاب گزینه “Reset to Defaults” انجام دهید.
- اگر مشکل همچنان ادامه داشت، سعی کنید اجزای سختافزاری غیرضروری مانند کارتهای توسعه یا دستگاههای ذخیرهسازی را از سرور حذف کنید و سپس سرور را دوباره روشن کنید.
توجه به این نکته ضروری است که تغییر ROM در سرور HPE فقط باید توسط متخصصان IT باتجربه انجام شود، زیرا بهروزرسانی یا تغییرات نامناسب فریمور باعث مشکلات جدی سیستم یا حتی از دسترفتن اطلاعات میشود.
برای موارد بالا و بررسی عمیقتر از Insight Diagnostics استفاده کنید. یک ابزار نرمافزاری ارائهشده توسط HPE است که برای تشخیص و عیبیابی مشکلات سختافزاری سرورهای HPE، از جمله خطاهای ۱۰۱-ROM استفاده میشود. از آنجایی که این ابزار برای ارائه اطلاعات دقیق در مورد سختافزار سرور طراحی شده است، میتواند در شناسایی مشکلات احتمالی این اجزا کمک کند. با پیامهای خطا و گزارشهای دقیقی که Insight Diagnostics ارائه میدهد، میتوان جزء سختافزاری خاصی که باعث خطا شده است را شناسایی کرد.
Insight Diagnostics را میتوان مستقیماً از فریمور سرور اجرا کرد یا آن را از طریق درایو USB یا CD قابلبوت نصب و اجرا کرد. این ابزار بسیار کاربرپسند است و دستورالعملهای گامبهگام برای اجرای تستها و تفسیر نتایج را ارائه میدهد. استفاده از Insight Diagnostics به متخصصان فناوری اطلاعات کمک میکند تا بهسرعت مشکلات سختافزاری سرورهای HPE، از جمله خطاهای ۱۰۱-ROM را با حداقل خرابی و از دست رفتن دادهها یا سایر مشکلات سیستم، شناسایی و حل کنند.
خطای Error 101-I/O ROM
خطای Error 101-I/O ROM در سرور HPE معمولاً بهدلیل وجود مشکل در قسمت ورودی/خروجی (I/O) فریمور ROM است. خرابی Option ROM در دستگاههای PCI، PCI-X یا PCI Express میتواند باعث خطای ROM 101-I/O در سرور شود. Option ROM یک فریمور است که در کارتهای توسعه تعبیه شده و مقداردهی اولیه و پیکربندی دستگاهها را در طول فرآیند بوت انجام میدهد. اگر Option ROM از کار بیفتد یا خراب شود، از تنظیم اولیه درست دستگاه جلوگیری میکند که بهنوبه خود باعث خرابی در قسمت ورودی/خروجی فریمورو خطای ROM 101-I/O میشود.
برای عیبیابی این خطا موارد زیر پیشنهاد میشود:
- فریمور سرور را به آخرین نسخه بهروزرسانی کنید.
- کابلهای شل یا آسیبدیده را بررسی کنید.
- کارتهای توسعه ورودی/خروجی را دوباره نصب کنید.
- قطعه سختافزاری معیوب را جایگزین کنید.
- تداخل با سایر دستگاهها یا پیکربندیهایی که میتواند باعث از کار افتادن Option ROM شود، را بررسی کنید.
- Option ROM دستگاه را بهروزرسانی کنید.
خطای System 101-Option ROM Checksum Error
مشاهده خطای System 101-Option ROM Checksum در سرورهای HPE بیانگر وجود مشکل در فریمور سرور است و بهطور خاص، نشان میدهد که فریمور (همچنین بهنام Option ROM) در تست Checksum موفق نبوده.
Checksum تست، الگوریتمی است که برای تأیید صحت دادهها، در این مورد فریمور، استفاده میشود. تست Checksum خرابی یا تغییر دادهها را بررسی میکند. فریموربهدلایل مختلفی مانند فریمورمعیوب، فلش فریمور خراب، یا مشکلات سختافزاری مربوط به expansion board یا حافظه و بایوس ممکن است در تست Checksum رد شود.
برای رفع این مشکل گاهی اوقات لازم است موارد زیر را انجام دهید:
- تنظیمات بایوس سرور را بهحالت پیشفرض خود برگردانید.( با فشار دادن کلید F2 یا Del میتوانید این کار را انجام دهید).
- Option ROM را با نسخه جدید فریمور دوباره فلش کنید.
- فریمور سرور را بهروزرسانی کنید.
- قطعه سختافزاری معیوب را جایگزین کنید.
- expansion board را دوباره نصب کنید.
expansion board که بهعنوان کارتهای افزودنی (add-in cards) نیز شناخته میشود، دستگاهی است که در اسلاتهای PCIe سرور قرار میگیرد تا عملکردهای اضافی مانند رابطهای اضافی شبکه، کنترلرهای ذخیرهسازی یا کارتهای گرافیک را ارائه دهد. اگر این قطعه دارای فریمور یا Option ROM خود باشد باید با فریمور سرور سازگار باشد. در صورتی که با فریمور سرور سازگار نباشد و یا در صورت وجود ایراد، بهطور بالقوه باعث ایجاد خطای System 101-Option ROM Checksum در سرور میشود. همچنین، Option ROM معیوب نیز باعث این خطا میشود. برای رفع خطا بهتر است expansion board را حذف کرده و سرور را مجددا راه اندازی کنید تا ببینید آیا خطا ادامه دارد یا خیر.
اگر پس از برداشتن expansion board، خطا برطرف نشد و هیچ یک از موارد بالا مشکل را برطرف نکرد، ممکن است لازم باشد تراشه Option ROM یا کل مادربرد را تعویض کنید. در این مورد، بهتر است از یک متخصص سرور یا تیم پشتیبانی فنی کمک بگیرید.
خطای ۱۰۲ سرور HPE
خطای ۱۰۲ یک کد سختافزاری است که نشان میدهد در برد سیستم یا مادربرد سرور بهدلایل مختلفی مانند قطعات معیوب، پیکربندی نادرست یا مشکلات الکتریکی خطایی رخ داده است.
خطای ۱۰۲ به چهار صورت ظاهر میشود. که در ادامه به آنها اشاره میکنیم. توجه داشته باشید که برای رفع و عیبیابی این خطاها ابتدا مطمئن شوید که سرور HPE شما بر روی آخرین نسخه نرمافزاری و فریمور اجرا میشود و طبق دستورالعملهای سازنده پیکربندی شده است. اگر مشکل حتی پس از انجام مراحل عیبیابی توصیهشده همچنان ادامه داشت، باید برای راهنمایی بیشتر با پشتیبانی فنی و متخصصین سرورهای HPE تماس بگیرید.
خطای ۱۰۲-System Board Failure
خطای “۱۰۲-System Board Failure” در سرور HPE معمولاً نشاندهنده یک مشکل در برد سیستم است که بهعنوان مادربرد نیز شناخته میشود. ایرادات تایمرهای ۸۲۵۴ و کنترلر DMA 8237 نیز اغلب باعث این خطا میشود.
برد سیستم، برد مدار اصلی در سرور است که تمام اجزای دیگر مانند CPU، RAM و دستگاههای ذخیرهسازی را به هم متصل میکند. این پیام خطا نشان میدهد که یک مشکل سختافزاری در برد سیستم وجود دارد که منجر به مشکلات مختلفی مانند ناپایداری سیستم، از دست دادن دادهها یا حتی خرابی کامل سیستم میشود. گاهی علت خاص این خطا بهدلیل مشکلاتی مانند مدار آسیبدیده، قطعه خراب یا فریمور معیوب است.
برای رفع این مشکل میتوانید مراحل زیر را امتحان کنید:
- کابلها یا اجزای شل یا جدا شدهای که ممکن است باعث این مشکل شوند را بررسی کنید.
- اجزای قابل جابهجایی مانند ماژولهای RAM یا کارتهای توسعه را مجدداً قرار دهید تا مطمئن شوید که درست به برد سیستم متصل شدهاند.
- فریمور و درایورهای سرور را بهروزرسانی کنید، زیرا نرمافزار قدیمی یا خراب میتواند باعث خرابی برد سیستم شود.
اگر هیچ یک از مراحل بالا مشکل را حل نکرد، ممکن است برای رفع مشکل نیاز به تعویض برد سیستم داشته باشید. توجه کنید از آنجایی که تلاش برای تشخیص یا رفع مشکلات سختافزاری در سرور پیچیده و بالقوه خطرناک است بهتر است با یک متخصص واجد شرایط یا تیم پشتیبانی ماهر در تماس باشید.
خطای ۱۰۲-System Board Failure, CMOS Test Failed
کد خطا “۱۰۲-System Failure, CMOS Test Failed” در سرورهای بیانگر مشکل در پیکربندی (CMOS) سیستم است.
CMOS یا (Complementary Metal-Oxide-Semiconductor) مقداری از حافظه در برد سیستم است که تنظیمات BIOS و پیکربندیهای سیستم مانند تاریخ و زمان، ترتیب راهاندازی و تنظیمات سختافزاری را ذخیره میکند.
تست CMOS یک تست تشخیصی است که یکپارچگی حافظه CMOS و توانایی آن در حفظ تنظیمات را بررسی میکند. اگر تست CMOS ناموفق باشد، به این معنی است که برد سیستم نمیتواند بهدرستی این دادهها را ذخیره یا به آنها دسترسی داشته باشد. پس حافظه CMOS خراب شده است، یا مشکلی در خود برد سیستم وجود دارد، مانند خراب شدن DMA controllers یا timers و یا قطعات مشابه آنها.
بنابراین این خطا بهدلایل مختلف زیر ممکن است بروز کند:
- باتری CMOS کارآمدی خود را از دست داده است.
- پیکربندی CMOS نادرست است.
- اجزای برد معیوب شده است.
برای رفع این خطا، ممکن است نیاز به تعویض برد سیستم یا هر قطعه معیوب داشته باشید. با این حال، قبل از انجام این کار، میتوانید با پاک کردن CMOS، حافظه آن را به تنظیمات پیشفرض برگردانید. این کار را با خارج کردن باتری CMOS یا با استفاده از جامپر CMOS روی برد سیستم انجام دهید. توجه کنید که جداسازی برد نیاز به تخصص و مهارت کافی دارد و نباید سرخود کاری انجام داد. برای تعویض برد سیستم و اجرای server setup utility حتما از متخصصین مربوطه کمک بگیرید.
خطای ۱۰۲-System Board Failure, DMA Test Failed
بروز این خطا در سرورهای HPE نشاندهنده مشکل در کنترلر (DMA) روی برد سیستم است. DMA یک ویژگی سختافزاری است که به دستگاهها اجازه میدهد دادهها را مستقیماً به و از حافظه بدون دخالت CPU منتقل کنند.
هنگامی که تست DMA با شکست مواجه میشود، به این معنی است که کنترلر بهدرستی کار نمیکند و ممکن است باعث ایجاد مشکلاتی در انتقال داده یا سایر عملیات سیستم شود.
تراشه DMA معیوب، قطعات آسیبدیده برد سیستم یا سایر مشکلات مربوط به سختافزار همگی باعث بروز خطای System Board Failure, DMA Test Failed میشود.
اگر در سرور HPE با این خطا مواجه شدید، توصیه میشود برای راهنمایی و پشتیبانی فنی با متخصصین در ارتباط باشید. ممکن است در صورت لزوم تعویض برد سیستم یا سایر اجزا نیاز باشد.
خطای ۱۰۲ -System Board Failure, Timer Test Failed
این پیغام خطا بیانگر یک مشکل سختافزاری با برد سیستم در سرور است و میتواند ناشی از تراشه تایمر معیوب یا سایر قطعات سختافزاری روی مادربرد باشد.
موارد زیر برای عیبیابی این مشکل توصیه میشود:
- تمام گزارشهای سرور در مورد هرگونه پیام خطا یا سرنخهایی که ممکن است باعث ایجاد مشکل شده باشد، را بررسی کنید.
- همه اجزاء از جمله کارتهای توسعه، ماژولهای حافظه و کابلها را ریست کنید.
- فریمور و درایورهای برد سرور و سایر اجزای سختافزاری را بهروز کنید.
اگر مشکل برطرف نشد، ممکن است لازم باشد برد سیستم را تعویض کنید.
جمعبندی
در این مقاله دو نوع از خطاهای عددی سرورهای HPE بهنام خطای ۱۰۱ و ۱۰۲ را بررسی کردیم. خطای ۱۰۱ بیانگر وجود مشکل در بارگذاری اطلاعات فریمور است که در نهایت از بالا آمدن صحیح آن جلوگیری میکند. در حالیکه خطای ۱۰۲ یک کد سختافزاری است که نشان میدهد در مادربرد سرور خطایی رخ داده است. توجه به این نکته ضروری است که کار بر روی سختافزار سرور نیاز به مهارت و دانش تخصصی دارد، بنابراین انجام هیچ گونه تعمیری توصیه نمیشود مگر اینکه تخصص لازم را داشته باشید. خواندن مستندات شرکتسازنده سرور و کمک گرفتن از افراد و شرکتهای تخصصی مانند مشاوران ارمغان اشراق در هنگام خرید سرورهای HPE، بهترین راه برای مقابله با مشکلات احتمالی است.
اگر برای عیبیابی خطاها راهحلهایی به ذهنتان میرسد بسیار خرسند خواهیم شد آن را در بخش کامنتها با ما بهاشتراک بگذارید.