Method for managing an uncorrectable, unrecoverable data error (UE) as the UE passes through a plurality of devices in a central electronics complex

   
   

A method and system for managing uncorrectable data error (UE) conditions as the UE passes through a plurality of devices in a central electronic complex (CEC) is disclosed. The method and system comprises detecting a UE-RE by at least one device in the CEC; and providing an attention signal by at least one device to a diagnostic system to indicate the UE-RE condition. The method and system further includes analyzing the UE-RE attention signal by the diagnostic system to produce an error log with a list of failing parts and a record of the log. A method and system in accordance with the present invention provides a new fault isolation methodology and algorithm, which extends the current capability of a service processor runtime diagnostic code (PRD). The method and system in accordance with the present invention allows for correct error isolation and for surfacing of appropriate service action messages on a processing system that has successfully recovered from an uncorrectable data error (UE) condition. The method allows for the accurate determination of an error source and provides appropriate service action if and when the system fails to recover from the UE condition.

Eine Methode und ein System für das Handhaben der uncorrectable Datenstörung (UE) Bedingungen als die UE Durchläufe durch eine Mehrzahl der Vorrichtungen in einem zentralen elektronischen Komplex (CEC) wird freigegeben. Die Methode und das System enthält das Ermitteln eines UE-RE durch mindestens eine Vorrichtung im CEC; und ein Aufmerksamkeit Signal von mindestens einer Vorrichtung zu einem Diagnosesystem zur Verfügung stellend, den UE-RE Zustand anzuzeigen. Die Methode und das System, die weiter sind, schließt das Analysieren des UE-RE Aufmerksamkeit Signals durch das Diagnosesystem, einen Störspeicher mit einer Liste der ausfallenden Teile und der Aufzeichnung des Maschinenbordbuches zu produzieren ein. Eine Methode und ein System in Übereinstimmung mit der anwesenden Erfindung liefert eine neue fehlerisolierung Methodenlehre und einen Algorithmus, der die gegenwärtige Fähigkeit eines Laufzeitdiagnose-Codes des Service-Prozessors (PRD) verlängert. Die Methode und das System in Übereinstimmung mit der anwesenden Erfindung läßt korrekte Störung Lokalisierung und Oberflächenbearbeitung der passenden Service-Aktionsnachrichten auf einem Verarbeitungssystem zu, das erfolgreich von einem uncorrectable Datenstörung (UE) Zustand erholt hat. Die Methode läßt die genaue Ermittlung einer Störung Quelle zu und liefert passende Service-Tätigkeit wenn und wenn das System von dem UE Zustand erholen nicht kann.

 
Web www.patentalert.com

< Method and system for leveraging spares in a data storage system including a plurality of disk drives

< Managing disk drive replacements on mulitidisk headless appliances

> Method and system to identify a memory corruption source within a multiprocessor system

> Memory sub-system error cleansing

~ 00155