Как стало известно вчера, первые готовые видеоадаптеры на основе Fermi стоит ожидать не раньше первого квартала 2010 года. Кроме этого, стали известны еще кое-какие подробности. Давайте забудем о задержке с выпуском и остановимся на них.
Первый Fermi GPU - GF100, как мы знаем, это 3 миллиарда транзисторов, ядро размером около 500 мм2. Сравните это с 2,15 миллиарда транзисторов, и 330 мм2 у Cypress на том же 40 нм техпроцессе TSMC. В действительности можно было бы подумать, что это продукты разного класса, но, как оказалось, это не так, и раскрывшиеся вчера подробности - тому подтверждение.
Первое: стоит заметить полное отсутствие сравнения с прямыми конкурентами - т.е. GPGPU ATI. Очевидно, что реальное преимущество в производительности Fermi будет только в расчетах с двойной точностью – и то, если бы у нее были соответствующие частоты.
А, исходя из пресс-релиза, с этим возникли проблемы, даже если иметь ввиду щедрое увеличение производительности новой архитектуры, и ситуация остается неопределенной. Так производительность в расчетах с ДТ (двойной точностью) оценивается в пределах 520 и 630 GFlops, а в то же время ATI Radeon HD 5870, который даже не должен быть прямым конкурентом, обладает вычислительной мощностью на уровне 544 GFlops, и это против предполагаемо «очень мощных» Fermi.
Рассмотрим производительность с одинарной точностью (SP) - гораздо более важным показателем для игр и графики. Изначально говорилось, что у GF100 частота шейдерного домена будет около 1,5 ГГц. На основании показателей в 520/630 GFlops можно сделать выводы, что шейдеры работают лишь на 1015 МГц и 1230 МГц соответственно.
Исходя из этого, можно предположить, что теоретическая производительность 512 ядер CUDA в SP находится между 1,05 и 1,26 TFlops. Даже если брать во внимание, что 1,05 TFlops - может быть производительностью адаптера с некоторым количеством отключенных конвейеров.
А теперь подумаем… Ведь никакого разгона не хватит, чтобы преодолеть огромный разрыв с уже доступными, но «вовсе не конкурентами» в лице HD 5870, который запросто выходит на 2,72 TFlops. Даже «слабый» HD 5770 имеет 1,36 TFlops! Конечно, шейдерные блоки у NVIDIA являются гораздо более эффективными, но никакое повышение частоты их работы не сможет компенсировать производительность.
Далее цена: даже самый дешевый Tesla c2050 стоит $2499, что почти на 50% больше, чем основанный на GT200 флагман предыдущего семейства Tesla C1060 - но ведь новое творение еще нужно постараться продать за такие деньги и оправдать их.
До сих пор мы сравниваем GF100 и Cypress. А в действительности ведь конкурентом продукта NVIDIA является Hemlock - 4,64 TFlops против 1,26 TFlops, конечно, не самое честное сравнение, но тут можно сетовать на ограничения технологии CrossFire и менее эффективные шейдерные блоки у ATI.
Еще более загадочным является «двухголовый» продукт на основе Fermi. Учитывая "типичные" показатели энергопотребления Tesla 20xx в 190W, будет крайне маловероятно создать такую карту, по крайней мере, в ближайшее время. Не говоря уже о том, что продукты GeForce могут в конечном итоге иметь выше частоты и значительно превышать TPB даже HD 5870, который в пике равен 188W, что ниже ожидаемого пикового у GF100 - 220W.
Еще мы не учитываем то, что GF100 еще нигде не видели, и вряд ли продукты на его основе будут на полках раньше, чем через 4-5 месяцев.
В конце концов, AMD имеют настоящий, «живой» продукт, воплощенный в кремнии, продающийся в магазинах, эффективный, экономичный и прекрасно масштабируемый. А вот у NVIDIA он есть только на бумаге. На данный момент нам остается только надеяться на "скрытые", или, если хотите, "волшебные" игровые возможности GF100, которые могут привнести революцию в видение того, как должен работать GPU.
А пока же у Fermi серьезные проблемы. _