El procesador más grande jamás construido incluye 1.2 billones de transistores, deja atrás a las CPU y GPU Intel y AMD de gama alta

Hardware / El procesador más grande jamás construido incluye 1.2 billones de transistores, deja atrás a las CPU y GPU Intel y AMD de gama alta 3 minutos de lectura

Fuente del procesador CerebrasSystems - HPCGuru

Una empresa ha logrado crear el chip de procesamiento más grande que jamás haya existido y que supera con creces cualquier cosa que Intel o AMD hayan producido. Con una locura de 1,2 billones de transistores en la oblea de silicio, el procesador es, con mucho, el chip semiconductor más grande jamás construido. La empresa detrás del procesador planea dedicar el chip a impulsar la Inteligencia Artificial (IA).

Cerebras Wafer Scale Engine, fabricado por la nueva empresa de inteligencia artificial Cerebras Systems, es el chip semiconductor más grande jamás construido. La Unidad Central de Procesamiento o CPU tiene 1,2 billones de transistores, que son los interruptores electrónicos de encendido y apagado más básicos y esenciales de cualquier chip de silicio. El procesador recientemente fabricado por el procesador Advanced Micro Devices tiene 32 mil millones de transistores. No hace falta mencionar que la cantidad de transistores en Cerebras Wafer Scale Engine supera con creces incluso las CPU y GPU AMD e Intel de gama alta.



El motor de escala de obleas de Cerebras es el procesador de chip único más grande jamás construido:

El Cerebras WSE es un enorme 46,225 milímetros cuadrados de una oblea de silicio que alberga 400,000 núcleos de cómputo optimizados para IA, sin caché, sin sobrecarga y 18 gigabytes de memoria SRAM local, distribuida y súper rápida como el único nivel de la memoria. jerarquía. En comparación, la GPU NVIDIA más grande mide 815 milímetros cuadrados y contiene 21,1 mil millones de transistores. Las matemáticas simples indicarán que Cerebras WSE es 56,7 veces más grande que la GPU NVIDIA de gama alta.



El ancho de banda de memoria de Cerebras WSE es de 9 petabytes por segundo. En otras palabras, el procesador más grande del mundo cuenta con 3000 veces más memoria en chip de alta velocidad y 10,000 veces más ancho de banda de memoria. Los núcleos del procesador están vinculados entre sí con una red de comunicación de malla fina, todo hardware, en chip conectado en malla. Debido a la arquitectura simplificada y al enorme tamaño de la matriz, combinados con un ancho de banda ultra alto, el procesador puede ofrecer un ancho de banda agregado de 100 petabits por segundo. En pocas palabras, la gran cantidad de núcleos de Cerebras WSE, más memoria local y un tejido de baja latencia y alto ancho de banda lo convierten en un procesador ideal para acelerar significativamente las tareas de inteligencia artificial.

¿Por qué Intel y AMD no están fabricando CPU y GPU tan enormes de diseño personalizado?

Intel, AMD y la mayoría de los demás fabricantes de chips de silicio adoptar un enfoque completamente diferente y tradicional. Las potentes GPU y CPU comúnmente disponibles son en realidad una colección de chips creados sobre una oblea de silicio de 12 pulgadas y se procesan en una fábrica de chips en un lote. El Cerebras WSE, por otro lado, es un solo chip interconectado en una sola oblea. En pocas palabras, todos los 1,2 billones de transistores en el procesador más grande realmente funcionan juntos como un solo chip de silicio gigante.



Existe una razón bastante simple por la que empresas como Intel y AMD no invierten en obleas de silicio tan increíblemente grandes. Una sola oblea de silicio tiene algunas impurezas, que pueden tener un efecto en cascada y eventualmente causar fallas. Los fabricantes de chips son conscientes de lo mismo y construyen sus procesadores en consecuencia. Por lo tanto, el rendimiento real de las obleas de silicio en términos de chips de silicio que funcionan de manera confiable es bastante bajo. En otras palabras, si la oblea de silicio tiene un solo chip, las posibilidades de que se produzcan impurezas y fallas son bastante altas.

Curiosamente, mientras que otras empresas no han encontrado una solución viable, se informa que Cerebras diseñó su chip para que sea redundante. En pocas palabras, una impureza no desactivará todo el chip, señaló Andrew Feldman, cofundador de Cerebras Systems y se desempeña como CEO. ' Diseñado desde cero para el trabajo de IA, Cerebras WSE contiene innovaciones fundamentales que hacen avanzar el estado de la técnica al resolver desafíos técnicos de décadas que limitaban los tamaños de chip, como la conectividad de retícula cruzada, el rendimiento, la entrega de potencia y embalaje. Cada decisión arquitectónica se tomó para optimizar el rendimiento del trabajo de IA. El resultado es que Cerebras WSE ofrece, según la carga de trabajo, cientos o miles de veces el rendimiento de las soluciones existentes en una pequeña fracción del consumo de energía y el espacio ”.

Las tareas de IA seguirán demandando chips más grandes:

El nuevo procesador está diseñado a medida para manejar tareas de IA principalmente porque los chips más grandes procesan la información más rápidamente, produciendo respuestas en menos tiempo. La mayoría de las empresas tecnológicas afirman que la limitación fundamental de la IA actual es que se tarda demasiado en entrenar modelos. Por lo tanto, algunos líderes tecnológicos están intentando optimizar sus algoritmos de inteligencia artificial para depender de menos conjuntos de datos. Sin embargo, cualquier buena IA obviamente mejorará con conjuntos de datos más grandes. Reducir el tiempo de entrenamiento aumentando el tamaño de la CPU es una forma de impulsar el procesamiento y reducir el tiempo de entrenamiento sin comprometer la calidad de la IA resultante.

El tejido de comunicación entre procesadores implementado en Cerebras WSE también es único en su tipo. La malla 2D de baja latencia y gran ancho de banda enlaza los 400.000 núcleos de la WSE con un total de 100 petabits por segundo de ancho de banda. Además, los núcleos del procesador son núcleos de álgebra lineal dispersos (SLAC), que están optimizados para primitivas informáticas de redes neuronales. Ambos aspectos ponen el chip muy por delante para las tareas de IA. Por lo tanto, es poco probable que los jugadores puedan comprar la CPU o GPU más grande y poderosa para sus PC.

Etiquetas amd intel