System and method for recovering from memory failures in computer systems

   
   

The present invention is a system and method for recovering from memory failures in computer systems. The method of the present invention includes the steps of: identifying a predetermined instruction sequence; monitoring for memory access errors in response to the request; logging a memory access error in an error logging register; polling the register for any logged memory access error during execution of the instruction sequence; and raising exceptions, if the memory access error is logged. Within the system of the present invention, memory access errors are stored in an error logging register, machine check abort handles are masked, and memory controllers are under full control of the software so that memory access errors can be intercepted and responded to without necessitating a system reboot or application restart. The present invention is particularly applicable to O/S code which can not otherwise recover from memory errors except by rebooting.

La presente invenzione è un sistema e un metodo per recuperare dai guasti di memoria nei sistemi di elaborazione. Il metodo di presente invenzione include i punti di: identificare una sequenza di istruzione predeterminata; controllando per gli errori di accesso di memoria in risposta alla richiesta; annotare un errore di accesso di memoria in un registro annotare di errore; votazione il registro per qualsiasi errore annotato di accesso di memoria durante l'esecuzione della sequenza di istruzione; e sollevando le eccezioni, se l'errore di accesso di memoria è annotato. All'interno del sistema di presente invenzione, gli errori di accesso di memoria sono immagazzinati in un registro annotare di errore, le maniglie della terminazione del controllo della macchina sono mascherate ed i regolatori di memoria sono sotto controllo completo del software in moda da potere essere intercettato e rispondere gli errori di accesso di memoria senza a rendere necessario un riavviamento di reboot o di applicazione del sistema. La presente invenzione è particolarmente applicabile al codice di O/S che non può recuperare al contrario dagli errori di memoria tranne rebooting.

 
Web www.patentalert.com

< Method to maintain nonvolatile system information cached in a distributed control network

< Method and apparatus for filtering error logs in a logically partitioned data processing system

> Method for global breakout identification

> Method and apparatus for detecting the type of interface to which a peripheral device is connected

~ 00158