В рамках конференции по суперкомпьютерам 2009 Intel неожиданно продемонстрировала рабочий образец Larrabee, вероятно, в качестве ответа на демо NVIDIA Fermi. В отличие от NVIDIA, в этом HPCC (High-Performance-Computing-Chip) стал доступен набор инструкций SGEMM, которые отображают реальную шейдерную производительность чипа методами матричного умножения (General Matrix Multiply).
Прототип имеет среднюю мощность в 417 Гигафлопс, а его максимальная производительность достигает 712 Гигафлопс, так что теоретическая производительность должна составлять примерно 800 Гигафлопc. На первый взгляд этого может показаться мало, но в тоже время можно заметить, что архитектура Larrabee от Intel обладает большей эффективностью, чем ее конкуренты. Например, NVIDIA Tesla C1060, теоретическая производительность которой, как и GTX 280, равна более чем 933 Гигафлопс, на практике "достигает" средней мощности всего лишь в 320 Гигафлопс. Таким образом, практическая эффективность чипов NVIDIA находится на отметке около 35%, а у Larrabee идет речь о 50% (с Fermi здесь сравнивать возможности нет, так как данные о ее "чистой" вычислительной мощности отсутствуют).
Следующей целью Intel, очевидно, было показать, что Larrabee также имеет хороший запас по частоте работы. Так при максимальном разгоне производительность чипа поднялась до 1006 вместо 712 Гигафлопс (40%).
Intel не сообщил, сколькими ядрами был оснащен прототип Larrabee. Наиболее вероятным, на наш взгляд, кажется количество 24*. Исходя из того, что каждое ядро имеет 16 SIMD единиц и может выполнять как целочисленные операции, так и операций с плавающей запятой, а теоретическая вычислительная производительность должна составлять порядка 800 Гигафлопс, частота ядра должна составлять около 1 ГГц. Если же взять во внимание информацию о разгоне, то 1,5 ГГц на каждое ядро – вполне реальный результат.
Но следует подчеркнуть что это только наши предположения. Ведь будущие модели могут быть оборудованы как 16, так и 32 ядрами, а соответственно высшими и низшими частотами.
Larrabee должен появиться на рынке в течение следующего года. Эта демонстрация стала всего лишь первой ласточкой из множества интересных новостей, ожидающих нас впереди.
*24 ядер х 16 SIMD процессоров х 2 инструкции за такт х 1000 МГц = 768 Гигафлопс