уменьшить токи утечки кристалла почти вчетверо! И это еще не все: рабочий ток затвора возрос на 10–15%, а электрическая емкость уменьшилась на 20%, что, по словам представителей Intel, обеспечивает почти 30–40-процентный прирост тактовых частот! Заодно всюду, где только можно, внедрили технологию «спящих транзисторов», отключающихся от питания, когда они не используются. Жестокие уроки непрерывно[В продаже успели побывать степпинги C0, D0, E0 и N0, а теперь вот и R0 подоспел…] оптимизировавшегося по тепловыделению сложнейшего ядра Prescott, очевидно, не прошли даром.
Тем не менее, заполучив в свое распоряжение прогрессивный техпроцесс, сильно изменять ядро Pentium 4 Prescott в связи с «похоронами» NetBurst разработчики не стали. Новые ядра (кодовое название CedarMill) «официально» получили кэш-память объемом 2 Мбайт, технологию виртуализации Intel Virtualization Technology (VT-x, aka Vanderpool) и сниженный с 14 до 12 минимальный множитель. Причем (сюрприз, сюрприз!) в степпингах E0 и R0 «старичка» Prescott мы все это уже видели. Даже тактовые частоты, несмотря на явный задел, поднимать не стали: для одноядерных CedarMill верхним пределом сегодня стала частота 3,6 ГГц (понижена с прежних 3,8 ГГц Prescott), а для двухъядерных Presler – 3,55 ГГц (повышена с 3,20 ГГц Smithfield). По сути, почти весь созданный новым технологическим процессом задел для повышения тактовой частоты (а если слова о 40% увеличения быстродействия транзисторов правдивы, то новые Pentium 4 могли бы постепенно достичь 5 ГГц) так и остался неиспользованным (хотя оверклокеры будут счастливы) – Intel улучшила лишь результаты откровенно провального Pentium D 3,20 ГГц. Отчасти это вызвано желанием снизить тепловыделение (в первом приближении оно пропорционально частоте), а отчасти «политическими» мотивами: все-таки NetBurst, при всех своих недостатках, была невероятно прогрессивной архитектурой, и грядущий «суперпроцессор» Conroe мог бы и не догнать «второй Northwood», неожиданно преодолевший технологические проблемы[А вот в Conroe, похоже, из 65-нм выжмут все, что только можно. И похоже, что ценой традиционно немаленького тепловыделения изначально «мобильного» чипа]. Вдобавок, похоже, что увеличенный до 4 Мбайт (2+2) кэш двухъядерников сыграл-таки негативную роль, поскольку снижения TDP для двухъядерных процессоров так и не произошло: оно по-прежнему составляет 130 Вт у старших моделей. Правда, измерения показывают, что новый 955-й Pentium Extreme Edition значительно экономичней прежнего лидера – 840-го (возможно, оценка в 130 Вт для предыдущего поколения была «слегка» оптимистична?), хотя и рассеивает тепла раза в полтора больше, чем сопоставимое по производительности решение конкурента. Так или иначе, на 10–20% тепловыделение новых процессоров снизили – и прекрасно.
Еще один немаловажный момент, связанный с новым технологическим процессом, -заметно возросшая производительность (в смысле – количественные возможности по выпуску процессоров с одной пластины) и пропорционально снизившаяся себестоимость производства. Площадь одноядерного CedarMill (с двухмегабайтным кэшем!) уменьшилась до скромнейших 81 кв. мм, мало того – новые двухъядерники, в отличие от ядра Smithfield, «собираются» из двух независимых ядер CedarMill в одном корпусе. В принципе, Smithfield и так был не более чем объединением двух ядер Prescott, но их приходилось делать в виде единого кристалла. Ну а теперь, похоже, нашелся удобный способ независимой упаковки двух кристаллов в один процессор. Кстати, Presler (это не отдельное ядро, а два CedarMill) станет не единственным процессором, использующий эту технологию: ближе к 2007 году похожим образом Intel собирается выпускать четырехъядерные процессоры, упаковывая по два двухъядерных кристалла. «Двойная упаковка» очень технологична (не нужно одновременно производить два типа кристаллов, меньше влияние возникающих дефектов, больше выход с одной пластины) и, в принципе, позволяет Intel легко перевести в 2006 году большую часть своих процессоров на использование двух ядер. Или, как вариант, сильно снизить цены на свою продукцию, и без того продающуюся недорого. «Продержаться» до выхода Conroe тоже как-то необходимо, а AMD, несмотря на сократившийся разрыв в производительности двухъядерных процессоров, пальму первенства по быстродействию и тепловыделению уступать в ближайшие полгода явно не намерена.
В мобильном секторе все гораздо сложнее. Новые 65-нм процессоры (кодовое название Yonah[Строго говоря, есть несколько разных Yonah. По числу ядер есть Yonah1 и Yonah2; а ближе к 2007 году, возможно, под названием Stealey выйдет и «дешевый» одноядерный Yonah1 с урезанной до 512 Кбайт кэш-памятью L2]) – впервые в мире мобильных CPU – являются двухъядерными, причем построенными на основе прогрессивной технологии, общей для двух ядер кэш- памяти второго уровня. Правда, два ядра – это удвоенное тепловыделение, которое трудно компенсировать даже более тонким технологическим процессом, поэтому при работе ноутбука от батарей процессор незаметно «превращается» в одноядерный, если мощность второго ядра не требуется. Добавили в процессор и поддержку технологии виртуализации Intel VT-x. Правда, кэш-память второго уровня увеличивать по сравнению с предыдущим поколением Dothan не стали – она так и осталась равной 2 Мбайт, что для одноядерных, что для двухъядерных вариантов. Заодно процессоры получили новую систему маркировки, а соответствующая платформа (Centrino третьего поколения) была названа Napa.
Далеко не везде от процессора требуется очень высокая производительность. Особенно если речь идет о производительности в вычислениях с плавающей точкой (FP). Например, Itanium в таких вычислениях несомненный лидер – и где x86, а где Itanium[На то, конечно, есть и другие важные причины, но…]? Зато частенько требуется обеспечить небольшое тепловыделение, причем как для ноутбуков, так и для настольных систем и, что самое парадоксальное, серверов. Парадоксальное – потому что для серверов, в принципе, не слишком важны тишина и сложность системы охлаждения – сервер все равно стоит в отдельном, а зачастую – и в специально кондиционируемом помещении[А завтра, глядишь, и к системе фреонового охлаждения подключать начнут. Вроде той разработки крупной российской компании Kraftway, о которой мы рассказывали в прошлогоднем #46]. Однако усиливающееся влияние кластерных систем диктует свои законы – и сегодня «в моде» блейд- серверы и прочие «тонкие» одно-двухъюнитовые решения, позволяющие установить в одну стойку множество небольших однотипных серверов. Желательно двух-, а еще лучше – четырехпроцессорных. И поскольку это совсем недорого – двухъядерных. Помножьте 130 (если не 180) ватт TDP двухъядерных Xeon на два сокета и 42 сервера в стойке – и представьте себе задачу энергоснабжения и последующего отвода более 12–16 кВт мощности. Особенно если таких стоек – целый зал. Нужно ли после этого удивляться, что располагающая более чем двумястами тысячами серверами Google решила расширить свою базу за счет серверов, построенных на процессорах AMD.
Впрочем, методики решения подобных «небыстрых, зато холодных» задач давным-давно отработаны и сводятся к использованию ноутбучных процессоров в несвойственных им системах. К примеру, новые десктопные системы от Apple используют процессоры Core Duo. С серверными процессорами так же просто поступить невозможно – они требуют специальной инфраструктуры, сертификации, чипсетов и, главное, возможности работать в многопроцессорных конфигурациях. Однако особого труда для Intel подобная адаптация, похоже, не составляет, так что уже в самое ближайшее время мы увидим серверную модификацию Core Duo на ядре Yonah в виде низковольтных семейств процессоров Xeon LV и Xeon ULV (ядро Sossaman). Работая на частотах порядка 1,67–2,0 ГГц, они не будут блистать производительностью и не будут поддерживать 64-битные расширения, – зато будут обладать более чем конкурентоспособными тепловыми пакетами в 31 и 16 Вт соответственно против 60/30 Вт у HE (и EE – модификаций Opteron[У Intel и AMD методики измерения тепловыделения CPU отличаются (Intel указывает типичное тепловыделение, AMD – максимальное), так что прямое сравнение TDP некорректно]). Выходящая в середине нынешнего года серверная ипостась Conroe – ядро Woodcrest – столь же низким тепловыделением похвастать не сможет, так что линейка Sossaman’ов в исполнении Socket 479, похоже, обречена на долгое пребывание на рынке.
В секторе «не-столь-компактных» систем дела обстоят проще: на смену текущему (прямо скажем, не слишком удачному) двухъядерному процессору Intel Xeon «Paxville», должен прийти заметно более производительный и менее горячий 65-нм эквивалент Presler под кодовым названием Dempsey. Обладая вдвое увеличенным кэшем L2, а также более быстрой 1066-МГц системной шиной, Dempsey обещает стать весьма интересным продуктом. Заодно с Paxville Dempsey вытеснит и одноядерный Xeon DP «Irwindale». В секторе MP-процессоров (4-сокетные системы и выше) на смену ядру Potomac (серверный аналог ядра Prescott с 1-Мб L2 и 8-Мб L3) придет сложнейший двухъядерный 65-нм процессор Tulsa с 16 Мбайт общей кэш-памяти L3. В отличие от других своих двухъядерных 65-нм собратьев Tulsa будет выполнен в виде одного кристалла (сказывается общий L3) с громадной площадью 435 кв. мм. 1,33 млрд. транзисторов – это