La comunidad científica es consciente de que defectos como la incapacidad para ejecutar operaciones de memoria inutilizan un núcleo. Lamentablemente, no es viable diseñar chips infalibles. Por tanto, el desarrollo de arquitecturas tolerantes a fallos que funcionen con mecanismos capaces de detectar y arreglar errores o de minimizar sus efectos podría permitir que los diseñadores de circuitos reutilicen los chips defectuosos en lugar de desecharlos.
Los defectos de fabricación, las perturbaciones ambientales que afectan a la producción y el envejecimiento son causas de que un chip deje de funcionar como es debido.
Algunos expertos afirman que la recuperación de chips desechados sería muy beneficiosa, sumada al uso de repuestos y la implantación de una técnica de detección, recuperación y reparación de errores. De este modo, su fiabilidad progresaría de forma considerable, serían más previsibles e incluso se podrían seguir utilizando pese a estar defectuosos.
Los socios del proyecto CRISP presentaron en el congreso DATE 2011 celebrado recientemente en Francia un chip de nueve núcleos capaz de realizar autodiagnóstico y autorreparación. En dicho evento mostraron cómo aprovechar la redundancia natural presente en los diseños de núcleo múltiple mediante la técnica diseñada por CRISP, que se sirve de núcleos reconfigurables de forma dinámica y de gestión de recursos.
En dicho evento, Gerard Rauwerda, de Recore Systems y coordinador del proyecto CRISP, declaró a New Electronics: «Una innovación clave reside en el desarrollo del Dependability Manager ["Gestor de la fiabilidad"], una unidad de generación de test que accede a la cadena de scan de autodiagnóstico incluida en el chip para realizar test de producción durante su tiempo en ejecución. Así se determina qué núcleos funcionan adecuadamente.» Los socios del proyecto crearon un IP «wrapper» [«envoltorio de protocolo de Internet»] en torno al núcleo dsp [procesador digital de señales] reconfigurable de Recore.
La incorporación de multiplexores permite que el software se ejecute tanto en modo funcional como de diagnóstico para detectar fallos. «Existen aspectos relacionados con la frecuencia que es necesario tener en cuenta, como por ejemplo si la velocidad del circuito es de, digamos, 200 megahercios (MHz) en online en lugar de 25MHz offline», indicó Rauwerda.
Tras completar el análisis del dispositivo, el gestor de recursos en tiempo de ejecución redirige tareas a partes del chip que no presentan errores. Así el chip queda reparado y puede seguir funcionando.
El Sr. Rauwerda afirmó que la técnica puede aplicarse a varios núcleos. En la actualidad, el enfoque adoptado por el proyecto pasa por identificar núcleos defectuosos no utilizables y determinar si la memoria del núcleo puede seguir utilizándose. «En el futuro trataremos de ejecutar diagnósticos a un nivel más profundo para comprobar si es posible utilizar más partes de un núcleo defectuoso», explicó. «Una interconexión que tolere fallos será de suma importancia. Precisaremos introducir estructuras con las que introducir estructuras de diagnóstico en los núcleos IP de interconexión de la NoC (red en un chip) para realizar diagnósticos más precisos.»
CRISP:
http://www.crisp-project.eu/
Los defectos de fabricación, las perturbaciones ambientales que afectan a la producción y el envejecimiento son causas de que un chip deje de funcionar como es debido.
Algunos expertos afirman que la recuperación de chips desechados sería muy beneficiosa, sumada al uso de repuestos y la implantación de una técnica de detección, recuperación y reparación de errores. De este modo, su fiabilidad progresaría de forma considerable, serían más previsibles e incluso se podrían seguir utilizando pese a estar defectuosos.
Los socios del proyecto CRISP presentaron en el congreso DATE 2011 celebrado recientemente en Francia un chip de nueve núcleos capaz de realizar autodiagnóstico y autorreparación. En dicho evento mostraron cómo aprovechar la redundancia natural presente en los diseños de núcleo múltiple mediante la técnica diseñada por CRISP, que se sirve de núcleos reconfigurables de forma dinámica y de gestión de recursos.
En dicho evento, Gerard Rauwerda, de Recore Systems y coordinador del proyecto CRISP, declaró a New Electronics: «Una innovación clave reside en el desarrollo del Dependability Manager ["Gestor de la fiabilidad"], una unidad de generación de test que accede a la cadena de scan de autodiagnóstico incluida en el chip para realizar test de producción durante su tiempo en ejecución. Así se determina qué núcleos funcionan adecuadamente.» Los socios del proyecto crearon un IP «wrapper» [«envoltorio de protocolo de Internet»] en torno al núcleo dsp [procesador digital de señales] reconfigurable de Recore.
La incorporación de multiplexores permite que el software se ejecute tanto en modo funcional como de diagnóstico para detectar fallos. «Existen aspectos relacionados con la frecuencia que es necesario tener en cuenta, como por ejemplo si la velocidad del circuito es de, digamos, 200 megahercios (MHz) en online en lugar de 25MHz offline», indicó Rauwerda.
Tras completar el análisis del dispositivo, el gestor de recursos en tiempo de ejecución redirige tareas a partes del chip que no presentan errores. Así el chip queda reparado y puede seguir funcionando.
El Sr. Rauwerda afirmó que la técnica puede aplicarse a varios núcleos. En la actualidad, el enfoque adoptado por el proyecto pasa por identificar núcleos defectuosos no utilizables y determinar si la memoria del núcleo puede seguir utilizándose. «En el futuro trataremos de ejecutar diagnósticos a un nivel más profundo para comprobar si es posible utilizar más partes de un núcleo defectuoso», explicó. «Una interconexión que tolere fallos será de suma importancia. Precisaremos introducir estructuras con las que introducir estructuras de diagnóstico en los núcleos IP de interconexión de la NoC (red en un chip) para realizar diagnósticos más precisos.»
CRISP:
http://www.crisp-project.eu/
No hay comentarios:
Publicar un comentario