
Исторически сложилось так, что основным способом, с помощью которого полупроводниковая индустрия с каждым годом увеличивала скорость микросхем, является сокращение транзисторов, чтобы большее их количество могло поместиться на процессоре. Cerebras Systems Inc. использует другой подход: вместо того, чтобы сделать транзисторы меньше, запуск калифорнийских чипов сделал процессор больше - намного больше.
Cerebras представил Scale Engine, это фактически суперкомпьютер на чипе с громадной пропускной способностью. И презентуется как самый большой процессор, когда-либо сделанный.
Wafer Scale Engine (сокращенно WSE), представляет собой 8,5-дюймовый янтарный элемент (на фото), содержащий не менее 1,2 триллиона транзисторов. Схемы WSE организованы в 400 000 процессорных ядер, специально оптимизированных для искусственного интеллекта, и 18 гигабайт высокоскоростной встроенной памяти.
Пропускная способность памяти достигает 9 Пбайт/с. Идеальная архитектура для ускорения задач, связанных с ИИ.
Вычислительные ядра могут быть оптимизированы для работы с любыми нейронными сетями. Архитектура ядер изначально фильтрует данные, представленные нулями. Это освобождает вычислительные ресурсы от необходимости проводить холостые операции умножения на ноль, что для нагрузки разрежёнными данными означает ускорение расчётов и предельную энергоэффективность. Тем самым процессор Cerebras оказывается в сотни или даже тысячи раз эффективнее для машинного обучения в терминах задействованной площади кристалла и его потребления, чем актуальные решения для ИИ и машинного обучения.
Cerebras выводит чип на рынок как часть устройства для центра обработки данных, которое имеет собственную систему водяного охлаждения для поглощения тепла от всех этих ядер. Эндрю Фельдман, исполнительный директор стартапа, сказал Fortune, что машина будет обеспечивать в 150 раз большую вычислительную мощность сервера с несколькими видеокартами Nvidia. Компания Cerebras заявляет, что ее устройство потребляет от 2 до 3% пространства и электроэнергии, которые потребуются для серверной фермы на базе Nvidia с той же вычислительной мощностью.
Эта эффективность является прямым результатом увеличенного форм-фактора WSE. В традиционной среде искусственного интеллекта, состоящей из нескольких отдельных графических процессоров, обрабатываемые данные должны постоянно перемещаться между разными чипами по относительно медленным сетевым каналам. Это не проблема для WSE, потому что все вычисления выполняются на одной плате.
Идея централизации процессов обработки на одном большом чипе для повышения эффективности была реализована на протяжении десятилетий. Однако ни одна компания до Cerebras не смогла осуществить ее из-за сложных технических проблем, связанных с реализацией концепции.
https://siliconangle.com/2019/08/19/1-2 ... processor/