mcelog에 H/W 오류 메세지가 지속적으로 발생하는 이슈 > LINUX 자료실

본문 바로가기

사이트 내 전체검색

뒤로가기 LINUX 자료실

mcelog에 H/W 오류 메세지가 지속적으로 발생하는 이슈

페이지 정보

작성자 jhseol 작성일 20-10-20 17:20 조회 21,234 댓글 0

본문

mcelog에 H/W 아래의 오류 메세지가 지속적으로 발생
____________________________________________________
Hardware event. This is not a software error.
MCE 0
CPU 10 BANK 9
TIME 1576028456 Wed Dec 11 10:40:56 2019
MCG status:
MCi status:
Error overflow
Corrected error
Error enabled
MCA: MEMORY CONTROLLER GEN_CHANNEL0_ERR
Transaction: Generic undefined request
STATUS d00003c000310080 MCGSTATUS 0
MCGCAP 1000c18 APICID 40 SOCKETID 1
CPUID Vendor Intel Family 6 Model 47
____________________________________________________

관련해서 H/W를 점검하여 의심되는 메모리(8개)를 전부 교환했으나
동일 증상이 계속 유지되어 메세지 발생인 'CPU 10 BANK 9'의 위치를 특정하는 방법을 문의

----------------------------------------------------------------

하드웨어 메모리 모듈의 물리 위치에 대해서는 kernel에서 확인 방법은 없고
단지 하드웨어 메모리의 상태 정보를 출력

관련 문서
What is the physical location of the memory module throwing MCE error?
  https://access.redhat.com/solutions/1308343

다만 메모리 자체의 문제일 수도 있지만 그 밖의 경우에도 에러가 보고된 사례가 있다.
즉, 바이오스나 메인보드측면의 개선이 필요한 경우도 있습니다.
====
    Faulty memory DIMM.
    Faulty memory controller (Usually onboard).
    Faulty memory lines on motherboard.
    Faulty BIOS.
    Overheating system.
    RAM latent junction failure (static discharge from a user).
    Power supply issues or short circuits.
====
관련 문서
What does the message "HARDWARE ERROR. This is *NOT* a software problem!" mean?
  https://access.redhat.com/solutions/67599

댓글목록 0

등록된 댓글이 없습니다.

Copyright © 소유하신 도메인. All rights reserved.

사이트 정보

회사명 : (주)리눅스데이타시스템 / 대표 : 정정모
서울본사 : 서울특별시 강남구 봉은사로 114길 40 홍선빌딩 2층 / tel : 02-6207-1160
대전지사 : 대전광역시 유성구 노은로174 도원프라자 5층 / tel : 042-331-1161

PC 버전으로 보기