La puce accélératrice géante de Cerebras motorisera les IA d’AWS
L’hyperscaler américain utilisera l’accélérateur WSE-3 d’une puissance de 125 pétaflops pour seconder ses propres puces Trainium3 dans ses services d’IA générative. La répartition des calculs entre les deux composants, appelée inférence désagrégée, est inédite.