Двухъядерные процессоры Intel и AMD: теория, часть 1
Итак, недавно два микропроцессорных гиганта – Intel и AMD – дружно выпустили свои первые двухъядерные процессоры, которые уже успели наделать много шума. Эти продукты стали не просто очередными конкурирующими новинками от лидеров отрасли персональных компьютеров (как это часто бывало в последние годы), но возвестили своим появлением о начале (не побоимся громких слов) целой эры (в тактическом и даже стратегическом понимании) «настольных» вычислений, очередного витка проникновения профессиональных технологий в потребительский сегмент. Новые микропроцессоры получились не просто интересными, но представляют собой весьма многогранные продукты, тщательное исследование которых не может ограничиться одним-двумя обзорами, написанными по горячим следам (каковыми можно признать большинство статей с тестами, спешно выполненными за несколько дней после получения сэмплов). Мы постараемся рассказать об этих новых продуктах более подробно и, по возможности, с разных сторон, не ограничивая себя жесткими временными рамками. Впрочем, мы также приглашаем к обсуждению этих продуктов и наших читателей – нa нашем Форуме и в виде авторских заметок, которые, при удачном сочетании таланта и смекалки их написавших, могут быть опубликованы на нашем ресурсе.
Но начнем мы, как и подобает, с теории. Благо, здесь явно есть, что обсудить.
Классификация: SMP, NUMA, кластеры…
Очевидно, что «ноги» у новых процессоров растут из многопроцессорных систем. А вариантов создания многопроцессорных систем – неисчислимое множество: даже простое перечисление всего созданного за прошедшие годы заняло бы слишком много места. Однако существует их общепринятая классификация:
1. SMP-системы (Symmetrical Multi Processor systems). В подобной системе все процессоры имеют совершенно равноправный доступ к общей оперативной памяти (см. рисунок). Работать с такими системами программистам – сущее удовольствие (если, конечно, создание многопоточного кода можно назвать «удовольствием»), поскольку не возникает никаких специфичных «особенностей», связанных с архитектурой компьютера. Но, к сожалению, создавать подобные системы крайне трудно: 2-4 процессора – практический предел для стоящих разумные деньги SMP-систем. Конечно, за пару сотен тысяч долларов можно купить системы и с большим числом процессоров… но при цене в несколько миллионов (!) долларов за SMP с 32-мя CPU становится экономически более целесообразно использовать менее дорогостоящие архитектуры.
3. Наконец, последний тип многопроцессорных систем – кластеры. Просто берем некоторое количество «почти самостоятельных» компьютеров (узлы кластера или «ноды») и объединяем их быстродействующими линиями связи. «Общей памяти» здесь может и не быть вообще, но, в принципе, и здесь её несложно реализовать, создав «очень неоднородную» NUMA-систему. Но на практике обычно удобнее работать с кластером в «явном» виде, явно описывая в программе все пересылки данных между его узлами. То есть если для NUMA еще можно создавать программы, почти не задумываясь над тем «как эта штука работает» и откуда берутся необходимые для работы потоков данные; то при работе с кластером требуется очень четко расписывать кто, что и где делает. Это очень неудобно для программистов, и, вдобавок, накладывает существенные ограничения на применимость кластерных систем. Но зато кластер – это очень дешево.
Многоядерные процессоры
Основные вехи в истории создания двухъядерных процессоров таковы:
1999 год – анонс первого двухъядерного процессора в мире (IBM Power4 для серверов)
2001 год – начало продаж двухъядерного IBM Power4
2002 год – почти одновременно AMD и Intel объявляют о перспективах создания своих двухъядерных процессоров
2002 год – выход процессоров Intel Xeon и Intel Pentium 4 с технологией Hyper-Threading, обеспечивающей виртуальную двухпроцессорность на одном кристалле
2004 год – свой двухъядерный процессор выпустила Sun (UltraSPARC IV)
2004 год – IBM выпустила второе поколение своих двухъядерных процессоров (IBM Power5). Каждое процессорное ядро Power5 поддерживает аналог технологии Hyper-Threading
2005 год, 18 марта – Intel выпустила первый в мире двухъядерный процессор архитектуры x86
2005 год, 21 марта – AMD анонсировала полную линейку серверных двухъядерных процессоров Opteron, анонсировала десктопные двухъядерные процессоры Athlon 64 X2 и начала поставки двухъядерных Opteron 8xx
2005 год, 20-25 мая – AMD начинает поставки двухядерных Opteron 2xx
2005 год, 26 мая – Intel выпускает двухъядерные Pentium D для массовых ПК
2005 год, 31 мая – AMD начинает поставки Athlon 64 X2
Intel Smithfield: «классика жанра»
При создании многоядерных процессоров для настольных ПК микропроцессорный гигант предпочел пойти на первых порах по пути «наименьшего сопротивления», продолжив традиции создания привычных для себя SMP-систем с общей шиной. Выглядит подобная MP-система чрезвычайно просто: один чипсет, к которому подключается вся оперативная память, и одна процессорная шина, к которой подключены все процессоры:
один чипсет, к которому подключается вся оперативная память, и одна процессорная шина, к которой подключены все процессоры
В случае новеньких двухъядерных процессоров Smithfield два обычных ядра, аналогичных Prescott, просто расположены рядом на одном кристалле кремния и электрически подключены к одной (общей) системной шине. Никакой общей схемотехники у этих ядер нет.
Intel Smithfield чип
У каждого «ядра» Smithfield – свой APIC, вычислительное ядро, кэш-память второго уровня и (что особенно важно) – свой интерфейс процессорной шины (Bus I/F). Последнее обстоятельство означает, что двухъядерный процессор Intel с точки зрения любой внешней логики будет выглядеть в точности как два обыкновенных процессора (типа Intel Xeon).
Сегодняшнее ядро Smithfield является «монолитным» (два ядра образуют единый кристалл процессора), однако следующее поколение настольных процессоров Intel (Presler, изготавливаемый по 65-нм технологии) будет еще тривиальнее – два одинаковых кристалла одноядерных процессоров (Cedar Mill) просто будут упакованы в одном корпусе (см. рис.).
![]()
![]()
Точно таким же будет и первый серверный процессор Intel данной микроархитектуры, известный сейчас под именем Dempsey. Но если у Smithfield на каждое из ядер приходится по 1 Мбайт кэш-памяти второго уровня, то у Presler и Dempsey это будет уже по 2 Мбайт на ядро.
![]()
![]()
Между тем, позднее у Intel пойдут другие, более сложные в плане микроархитектуры варианты двухъядерных процессоров, среди которых стоит отметить Montecito (двухъядерный Itanium), Yonah (двухъядерный аналог Pentium M) и Paxville для многопроцессорных серверов на базе Intel Xeon MP. Еще в марте этого года Патрик Гелсингер объявил, что в разработке у Intel находятся аж 15 различных многоядерных CPU, и пять из них корпорация даже демонстрировала в работе.
Причем, если еще в середине 2004 года официальные лица Intel отмечали, что многоядерные процессоры – это не «очередная гонка за производительностью», поскольку программная инфраструктура была тогда еще не очень готова поддержать такие процессоры оптимизированными приложениями, то теперь многоядерность у Intel поставлена во главу угла во всех базовых направлениях деятельности, в том числе – в разработке и отладке приложений (ну разве что кроме коммуникаций и сенсорных сетей – пока ;)). И в этом нет ничего удивительного – тактовую частоту процессоров стало наращивать все труднее и труднее, и, стало быть, надо искать что-то на cмену «гонки за мегагерцами». А добавляя ядра, производительность в ряде современных приложений уже можно заметно поднять, не повышая частоты. Да и пресловутый закон Мура (удвоение числа транзисторов на кристаллах) надо бы чем-то поддержать, а многоядерность – чуть ли не самый простой путь для этого… 🙂
Собственно, мультиядерность в текущем понимании Intel – это один из трех возможных вариантов:
мультиядерность в текущем понимании Intel
Похожий вариант – когда несколько одинаковых ядер расположены на разных кристаллах, но объединены вместе с одном корпусе процессора (многочиповый процессор). Таким будет 65-нанометровое поколение процессоров семейств Pentium и Xeon на ядрах Presler и Dempsey.
Наконец, ядра могут быть тесно переплетены между собой на одном кристалле и использовать некоторые общие ресурсы кристалла (скажем, шину и кэш-память). Таким является ближайший Itanium на ядре Montecito. А также мобильный Yonah, выход которого обещает наделать очень много шума.
Попутно отметим, что Montecito, изготавливаемый по 90-нм техпроцессу, будет иметь по сравнению с предшественником на 130-нм ядре Madison и ряд других преимуществ: наличие Hyper-Threading (то есть он будет виден в системе как 4 логических процессора), заметно меньшее энергопотребление, более высокую производительность (в 1,5 раза и выше), вчетверо больший размер кэш-памяти (свыше 24 Мбайт: 21 Мбайт L2 инструкций, 212 Мбайт L3 данных), 1,72 миллиарда транзисторов против 410 миллионов и другое. Выйдет этот процессор в четвертом квартале 2005 года.
Не менее интересным ожидается и первый двухъядерный мобильный процессор Yonah, который должен появиться в начале 2006 года в рамках новой мобильной платформы Napa. Yonah будет иметь два вычислительных ядра, использующих общую 2-мегабайтную кэш-память второго уровня и общий же контроллер системной шины QPB с частотой 667 МГц. Он будет выпускаться по 65-нм технологии в форм-факторах PGA 478 и BGA 479, содержать 151,6 млн. транзисторов, поддерживать технологию XD-bit и, судя по предварительной информации, поддерживать некоторые механизмы прямого взаимодействия ядер между собой.
Более того, Intel не исключают и того, что процессоры на «мобильном» ядре Yonah будут использоваться не только в определенных сегментах рынка настольных компьютеров (для этого уже разработаны и демонстрируются соответствующие мини-концепты домашнего и офисного ПК), но даже в компактных экономичных серверах.
Общие планы перехода Intel на двуядерную и многоядерную архитектуру процессоров показаны на рисунке. Первым восьмиядерным процессором Intel станет, по всей видимости, Tukwila в 2007 году, продолжающая линейку Intel Itanium.
планы перехода Intel на двуядерную и многоядерную архитектуру
Intel Server Roadmap
Аналогично двухъядерность «аукнулась» и в линейке Intel Xeon – отчасти именно из-за увеличения нагрузки на шину QPB, которую используют эти двухъядерные процессоры, Intel и задерживается с выпуском двухъядерных Xeon MP для четырех и более процессорных систем, предпочитая разработать для них новый 90-нм кристалл Paxville, который будет иметь общий на два процессорных ядра контроллер системной шины (чтобы снизить нагрузку на нее), хотя кэш-память по-прежнему будет своя у каждого из ядер. Двухпроцессорные же Xeon на первых порах останутся чисто «двухкристальными» Dempsey.
Платформа на Dempsey
Платформа на Dempsey
Платформа на Paxville
Платформа на Paxville
«Классическая» двухпроцессорная SMP-система с двухъядерными процессорами
«Классическая» двухпроцессорная SMP-система с двухъядерными процессорами
| Немного о терминологии Внимательные читатели уже обратили внимание на «загадочные» блоки с подписями APIC, DMA, GART… что все они означают? • APIC (Advanced Programmable Interrupt Controller) – одна из важнейших «деталек» любого компьютера. Это небольшая схема, занимающаяся сбором и обработкой возникающих в компьютере прерываний. Скажем, нажал пользователь клавишу на клавиатуре – контроллер клавиатуры зафиксировал это событие, занес код нажатой клавиши в свою встроенную память – и сгенерировал прерывание – выдал по специальной линии сигнал-запрос с просьбой прервать выполнение текущей программы и обработать событие «нажата клавиша на клавиатуре». Это, так сказать, «классическая» задача Interrupt Controller-ов: они позволяют процессору не терять зря время, регулярно опрашивая каждое из устройств на предмет того, «а не случилось ли там чего-нибудь за последние 10 мс». Но задачи IC не ограничиваются только этим: помимо аппаратных существуют еще и программные прерывания (exceptions), которые генерирует не периферия, а сам процессор – в случае возникновения какой-либо нештатной ситуации. Типичные примеры – в программе встретилась непонятно какая, или просто запрещенная «простому пользователю» инструкция (#GP, General Protection Exception), произошло деление на ноль (#DE, Divide-by-Zero Error Exception), программа обратилась к несуществующему адресу в памяти (#PF, Page Fault Exception). Некоторые прерывания может генерировать сама программа (INTn), а, скажем, прерывание #BP (BreakPoint Exception) используется операционной системой для отладки программ. Реакция на каждое из прерываний задается так называемым вектором прерываний – набором адресов в памяти, описывающих «что делать дальше» процессору в случае возникновения прерывания: какие функции (обработчики прерывания) ему в этом случае необходимо выполнять. В общем, PIC-и были, есть и будут одной из ключевых компонент компьютера. Причем в случае многопроцессорных, многоядерных (и даже в случае процессоров с Hyper-Threading!) требуется обеспечить по APIC-у на каждое ядро процессора (включая каждое виртуальное ядро в Pentium 4 supporting Hyper-Threading), обрабатывающих «программные прерывания, и еще один, «синхронизирующий» APIC в чипсете, который обеспечивает обработку аппаратных прерываний и, занимается «рассылкой» программных прерываний в тех случаях, когда возникшее на одном процессоре прерывание почему-то затрагивает и остальные процессоры. • DMA (Direct Memory Access) – это такой своеобразный «альтернативный процессор», который занимается в чипсете обработкой «фоновых» задач, связанных с периферией. Скажем, если процессору требуется прочитать пару килобайт данных с жесткого диска, то ему вовсе не обязательно терпеливо ждать целую вечность (несколько миллисекунд), пока эти самые данные ему не будут предоставлены. Вместо этого он может запрограммировать DMA-контроллер, чтобы тот выполнил эту задачу за него, и переключиться, пока этот запрос выполняется, на какую-нибудь другую задачу. Штука это не столь незаменимая, как APIC, но без неё не было бы даже интерфейса Ultra ATA/33 • GART (Graphical Address Relocation Table) появился в компьютерах одновременно с шиной AGP: это небольшая схема, которая обеспечивает графическому ускорителю доступ к системной памяти процессора. Её задачи – реализация механизма виртуальной памяти для GPU, то есть отображение «линейного» адресного пространства, с которым работает ускоритель, на «реальное», произвольным образом «перетасованное» с «обычными данными». Позволяет современным 3D-ускорителям использовать не только «набортную» видеопамять, но и «основную» системную память компьютера. |
AMD Toledo: SUMA, SRI и интегрированный Northbridge
Архитектура AMD K8 не просто отличается от «интеловской»: она концептуально иная, поскольку в ней нет какого-то выделенного центра. Каждый из процессоров архитектуры AMD64 является независимой и «самодостаточной» единицей, объединяющей в себе почти всю функциональность северного моста традиционных наборов системной логики. Это началось с одноядерных процессоров, а с появлением двухъядерников «обросло» новыми отличиями. Взглянем на блок-схему двухпроцессорной системы на двухъядерных AMD Opteron.
Многоядерные процессоры: принципы работы

Многоядерные процессоры представляют собой центральные процессоры, в которых содержится более двух вычислительных ядер. Такие ядра могут находиться как в одном корпусе, так и на одном процессорном кристалле.
Что такое многоядерный процессор?
Чаще всего под многоядерными процессорами понимают центральные процессоры, в которых несколько вычислительных ядер интегрированы в одну микросхему (то есть они расположены на одном кристалле кремния).
Hyper-threading
Ядра в многоядерных процессорах могут поддерживать технологию SMT, позволяющую исполнять несколько потоков вычислений и создавать на основе каждого ядра несколько логических процессоров. На процессорах, которые выпускает компания Intel, такая технология называется «Hyper-threading». Благодаря ей можно удваивать число логических процессоров по сравнению с числом физических чипов. В микропроцессорах, поддерживающих эту технологию, каждый физический процессор способен сохранять состояние двух потоков одновременно. Для операционной системы это будет выглядеть, как наличие двух логических процессоров. Если в работе одного из них возникает пауза (например, он ждет получения данных из памяти), другой логический процессор приступает к выполнению собственного потока.
Виды многоядерных процессоров
Многоядерные процессоры подразделяются на несколько видов. Они могут поддерживать использование общей кэш-памяти, а могут не поддерживать. Связь между ядрами реализуется на принципах использования разделяемой шины, сети на каналах точка-точка, сети с коммутатором или использования общего кэша.
Принцип работы
Большинство современных многоядерных процессоров работает по следующей схеме. Если запущенное приложение поддерживает многопоточность, оно может заставлять процессор выполнять несколько заданий одновременно. Например, если в компьютере используется 4-ядерный процессор с тактовой частотой 1.8 ГГц, программа может «загрузить» работой сразу все четыре ядра, при этом суммарная частота процессора будет составлять 7.2 ГГц. Если запущено сразу несколько программ, каждая из них может использовать часть ядер процессора, что тоже приводит к росту производительности компьютера.
Многие операционные системы поддерживают многопоточность, поэтому использование многоядерных процессоров позволяет ускорить работу компьютера даже в случае приложений, которые многопоточность не поддерживают. Если рассматривать работу только одного приложения, то использование многоядерных процессоров будет оправданным лишь в том случае, если это приложение оптимизировано под многопоточность. В противном случае, скорость работы многоядерного процессора не будет отличаться от скорости работы обычного процессора, а иногда он будет работать даже медленнее.
Как процессор становился многоядерным?
…в процессе развития количество ядер будет становиться всё больше и больше.
Разработчики Intel
• 1999 г. – анонсирован первый в мире 2-ядерный CPU – серверный RISC-процессор IBM Power 4.
Стартовала эпоха многоядерных процессоров!
• 2001 г. – начались продажи 2-ядерных процессоров IBM Power 4.
• 2002 г. – о перспективах использования двух ядер в своих процессорах архитектуры K8 заявила компания AMD. Практически одновременно с аналогичным заявлением выступила Intel.
• Декабрь 2002 г. – вышли первые десктопные Intel Pentium 4, поддерживающие «виртуальную» 2-ядерность – технологию Hyper-Threading.
• 2004 г. – IBM выпустила второе поколение своих 2-ядерных процессоров – IBM Power 5. Каждое из ядер Power 5 поддерживает одновременное выполнение двух программных потоков (то есть снабжено аналогом Hyper-Threading).
• 18 апреля 2005 г. – Intel выпустила первый в мире настольный 2-ядерный процессор Pentium Extreme Edition 840 (кодовое название – Smithfield). Выполнен с использованием 90-нм технологии.
• 21 апреля 2005 г. – AMD представила линейку 2-ядерных процессоров Athlon 64 X2 (кодовое название – Toledo) с тактовой частотой от 2,0 до 2,4 ГГц. Выполнены с использованием 90-нм технологии.
• 1 августа 2005 г. – AMD представила линейку 2-ядерных процессоров Athlon 64 X2 (кодовое название – Manchester) с тактовой частотой от 2,0 до 2,4 ГГц. Выполнены с использованием 90-нм технологии.
• В течение второго полугодия 2005 г. Intel выпускает:
– линейку 2-ядерных процессоров Pentium D 8** (кодовое название – Smithfield) с тактовой частотой от 2,8 до 3,2 ГГц. Выполнены с использованием 90-нм технологии. 2-ядерные процессоры Pentium D – это два независимых ядра, объединенных на одной кремниевой пластине. Ядра процессоров базируются на архитектуре NetBurst процессоров Pentium 4;
– линейку 2-ядерных процессоров Pentium D 9** (кодовое название – Presler) с тактовой частотой от 2,8 до 3,4 ГГц. Выполнены с использованием 65-нм технологии (следует отметить, что инженеры Intel воспользовались преимуществом 65-нм технологического процесса, который позволяет либо уменьшить площадь кристалла, либо увеличить количество транзисторов).
• 23 мая 2006 г. – AMD представила линейку 2-ядерных процессоров Athlon 64 X2 (кодовое название – Windsor) с тактовой частотой от 2,0 до 3,2 ГГц. Выполнены с использованием 90-нм технологии.
• 27 июля 2006 г. – компания Intel представила линейку 2-ядерных процессоров Intel Core 2 Duo (кодовое название – Conroe) с тактовой частотой 1,8 – 3,0 ГГц. Выполнены с использованием 65-нм технологического процесса.
• 27 сентября 2006 г. – Intel продемонстрировала прототип 80-ядерного процессора. Предполагается, что массовое производство подобных процессоров станет возможно не раньше перехода на 32-нанометровый техпроцесс (предположительно, в 2010 г.).
• Ноябрь 2006 г. – Intel выпустила линейку 4-ядерных процессоров Intel Core 2 Quad Q6*** (кодовое название – Kentsfield) с тактовой частотой 2,4 – 2,6 ГГц. Выполнены с использованием 65-нм технологии. Фактически представляют собой сборку из двух кристаллов Conroe в одном корпусе.
• 5 декабря 2006 г. – AMD представила линейку 2-ядерных процессоров Athlon 64 X2 (кодовое название – Brisbane) с тактовой частотой от 1,9 до 2,8 ГГц. Выполнены с использованием 65-нм технологии.
• 10 сентября 2007 г. – AMD выпустила нативные (в виде одного кристалла) 4-ядерные процессоры для серверов AMD Quad-Core Opteron (кодовое название – Barcelona). Выполнены с использованием 65-нм технологии.
• 19 ноября 2007 г. – AMD выпустила 4-ядерный процессор для домашних компьютеров AMD Quad-Core Phenom. Выполнен с использованием 65-нм технологии.
• Ноябрь 2007 г. – компания Intel представила линейку 2-ядерных процессоров Penryn с тактовой частотой от 2,1 до 3,3 ГГц. Выполнены с использованием 45-нм технологии.
• 6 января 2008 г. – компания Intel выпустила (под марками Core 2 Duo и Core 2 Extreme) первые партии 2-ядерных процессоров Penryn, выполненных с использованием 45-нм технологии.
• Март 2008 г. – одноядерные процессоры семейства Pentium 4 (661, 641 и 631) и 2-ядерные семейства Pentium D (945, 935, 925 и 915) сняты с производства.
• Март 2008 г. – компания AMD выпустила 3-ядерные процессоры Phenom X3 8400, 8600, 8450, 8650 и 8750 с тактовой частотой от 2,1 до 2,4 ГГц. Выполнены по 65-нм технологии. Фактически эти процессоры представляют собой 4-ядерные Phenom с одним отключенным ядром. Анонсированы эти процессоры были в сентябре 2007 г. По словам разработчика, подобные чипы рассчитаны на тех, «кому двух ядер мало, но за четыре он платить не готов».
Основное достоинство 3-ядерных процессоров заключается в том, что они имеют более низкую по сравнению с 4-ядерными чипами стоимость, но работают быстрее 2-ядерных, таким образом, заполняя ассортиментное пространство между теми и другими. Главный конкурент AMD – корпорация Intel – такие процессоры не выпускает. Впервые о намерении приступить к производству подобных чипов AMD объявила в 2007 г.
• Март 2008 г. – компания AMD на выставке CeBIT 2008 в Ганновере представила свои первые процессоры, изготовленные на базе 45-нм технологического процесса. 4-ядерные чипы под кодовым названием Shanghai для серверов и Deneb для настольных систем были изготовлены на фабрике Fab 36 в Дрездене, Германия. Для их производства использовались 300-мм подложки. Техпроцесс с топологическим уровнем 45 нм был разработан компанией AMD совместно с ее партнером, корпорацией IBM. Новые процессоры Shanghai и Deneb, как и Phenom X4, являются «по-настоящему» 4-ядерными, так как все четыре ядра размещены на одной кремниевой подложке.
• Апрель 2008 г. – компания AMD выпустила 4-ядерные процессоры Phenom X4 – 9550, 9650, 9750 и 9850 – с тактовой частотой 2,2–2,5 ГГц. Выполнены по 65-нм технологии.
• Май 2008 г. – выпущен 8-ядерный процессор Cell от IBM. Используется в PlayStation.
• Сентябрь 2008 г. – компания Intel выпустила линейку 4-ядерных процессоров Intel Core 2 Quad Q8*** (кодовое название – Yorkfield) с тактовой частотой 2,3 – 2,5 ГГц. Выполнены с использованием 45-нм технологии.
• Сентябрь 2008 г. – компания Intel выпустила линейку 4-ядерных процессоров Intel Core 2 Quad Q9*** (кодовое название – Yorkfield) с тактовой частотой 2,5 – 3,0 ГГц. Выполнены с использованием 45-нм технологии.
• 15 сентября 2008 г. – на конференции VMworld, организованной компанией VMware, корпорация Intel официально сообщила о выходе первого в отрасли массового 6-ядерного серверного процессора Xeon 7400 (кодовое название чипов – Dunnington). Фактически представляет собой три 2-ядерных кристалла, объединенных в одном корпусе. Создан по 45-нм технологии, работает на частоте 2,66 ГГц. Может работать с несколькими операционными системами одновременно. Имеет аппаратную поддержку технологии виртуализации (Intel Virtualization Technology).
• Октябрь 2008 г. – компания Intel разработала 80-ядерный процессор. Изготовлен он по 65-нм технологии, что позволило уменьшить его размеры, но, тем не менее, он остается еще слишком большим для коммерческого использования. Скорее всего, в ближайшие 7 лет процессор будет находиться в стадии доработки. На данный момент существующие технологии не позволяют снизить его энергопотребление и размеры. По мнению специалистов, массовое производство станет возможно только после 2012 г., когда Intel освоит 10-нм техпроцесс. На данный момент известно, что компания планирует введение 32-нм технологии производства процессоров в конце 2009 г., а 22-нм – в 2011 г.
Сейчас процессор не способен даже запустить операционную систему, но это не смущает разработчиков. Происходит масштабная «обкатка» новых функций, которые будут применяться в будущем в процессорах, одной из которых станет smart-функция по отключению неиспользуемых ядер, что положительно скажется на потреблении электроэнергии и тепловыделении.
• 17 ноября 2008 г. – Intel представила линейку 4-ядерных процессоров Intel Core i7, в основу которых положена микроархитектура нового поколения Nehalem. Процессоры работают на тактовой частоте 2,6 – 3,2 ГГц. Выполнены по 45-нм техпроцессу. Их главной особенностью является то, что контроллер памяти стал составной частью процессора. Это позволило увеличить скорость работы чипа с модулями оперативной памяти и сделало ненужной фронтальную системную шину FSB.
• Декабрь 2008 г. – начались поставки 4-ядерного процессора AMD Phenom II 940 (кодовое название – Deneb). Работает на частоте 3 ГГц, выпускается по техпроцессу 45-нм.
• Февраль 2009 г. – компания AMD продемонстрировала первый 6-ядерный серверный процессор. Выполнен с использованием 45-нм технологии. Кодовое название процессора – Istanbul, он придет на смену серверным процессорам Opteron с кодовым названием Shanghai, которые имеют только 4 ядра. Массовый выпуск таких чипов планируется начать во II половине 2009 г.
• Февраль 2009 г. – компания AMD объявила о начале поставок новых моделей:
– 3-ядерный Phenom II X3 (кодовое название чипа – Toliman) с тактовой частотой 2,8 ГГц. Выполнен по 45-нм технологии;
– 4-ядерный Phenom II X4 810 (кодовое название чипа – Dragon) с тактовой частотой 2,6 ГГц. Выполнен по 45-нм технологии.
• Апрель 2009 г. – компания Intel начала поставки 32-нм центральных процессоров Westmere производителям ПК, как мобильных систем, так и десктопов. Пока речь не идет о готовых коммерческих решениях, а лишь о первых тестовых экземплярах, основное предназначение устройств – их тестирование для выявления некоторых особенностей работы, чтобы производители смогли отладить конструкцию своих систем, и выпустить в продажу полностью совместимые с новым поколением процессоров компьютеры.
По своей сути, процессоры Westmere представляют собой изготовленную по 32-нм техпроцессу архитектуру Nehalem. Семейство включает в себя две категории микрочипов: решения для настольных компьютеров (кодовое обозначение – Clarkdale), и устройства для мобильных систем (кодовое обозначение – Arrandale).
«Мобильные» процессоры Arrandale включают не только само процессорное ядро, но и интегрированную графику. Согласно заверениям разработчиков, такая архитектура позволяет существенно снизить энергопотребление связки процессор–системная логика с интегрированной графикой. Помимо этого, за счет перехода на более прецизионный технологический процесс, снизится стоимость изготовления самих микрочипов, а за счет интеграции большего количества элементов на одном «кристалле» снижается и стоимость готовых мобильных компьютеров.
Поставки серийных экземпляров процессоров Westmere должны стартовать к концу 2009 г.
• Апрель 2009 г. – компания AMD выпустила две новые модели 4-ядерных центральных процессоров для ПК – Phenom II X4 955 Black Edition и Phenom II X4 945. Выполнены по 45-нм технологии.
• 14 мая 2009 г. – компания Fujitsu объявила о создании самого производительного в мире процессора, способного выполнять до 128 млрд. операций с плавающей запятой в секунду. Процессор SPARC64 VIIIfx (кодовое название Venus) работает примерно в 2,5 раза быстрее, чем самый мощный чип крупнейшего в мире поставщика микросхем корпорации Intel.
Увеличение скорости работы стало возможным за счет более плотной интеграции схем процессора и перехода на 45-нм технологию. Ученые смогли расположить на кремниевой пластинке площадью 2 см 2 8 вычислительных ядер, вместо 4-х в предыдущих разработках. Снижение уровня топологии также привело к сокращению потребления электроэнергии. В Fujitsu заявляют, что их чип потребляет в 3 раза меньше энергии, чем современные процессоры Intel. Помимо 8 ядер, чип включает в себя контроллер оперативной памяти.
Процессор SPARC64 VIIIfx планируется использовать в новом суперкомпьютере, который будет построен в институте естественных наук RIKEN в Японии. В него войдут 10 тыс. таких чипов. Суперкомпьютер планируется использовать для прогнозирования землетрясений, исследований медицинских препаратов, ракетных двигателей и прочих научных работ. Запустить компьютер планируется до весны 2010 г.
• Май 2009 г. – компания AMD представила разогнанную версию графического процессора ATI Radeon HD 4890 с тактовой частотой ядра, увеличенной с 850 МГц до 1 ГГц. Это первый графический процессор, работающий на частоте 1 ГГц. Вычислительная мощность чипа, благодаря увеличению частоты, выросла с 1,36 до 1,6 терафлоп (следует заметить, что видеокарты на базе разогнанной версии Radeon HD 4890 не нуждаются в жидкостном охлаждении – достаточно вентилятора).
• 27 мая 2009 г. – корпорация Intel официально представила новый процессор Xeon под кодовым названием Nehalem-EX. Процессор будет содержать до 8 вычислительных ядер, поддерживая обработку до 16 потоков одновременно. Объем кэш-памяти составит 24МБ.
В Nehalem-EX реализованы новые средства повышения надежности и облегчения технического обслуживания. Процессор унаследовал некоторые функции, которыми обладали чипы Intel Itanium, например, Machine Check Architecture (MCA) Recovery. Также в 8-ядерном процессоре реализованы технологии Turbo Mode и QuickPath Interconnect. Первая технология отвечает за то, чтобы остановленные ядра можно было привести в «боевое состояние» почти мгновенно (что повышает производительность процессора), а вторая технология позволяет ядрам процессора напрямую обращаться к контроллерами ввода/вывода на скорости до 25,5 Гб/сек.
Nehalem-EX способен обеспечить в 9 раз более высокую скорость работы оперативной памяти по сравнению с Intel Xeon 7400 предыдущего поколения.
Новый чип подходит для объединения серверных ресурсов, виртуализации, запуска приложений с интенсивной обработкой данных и для проведения научных исследований. Его массовое производство планируется начать во второй половине 2009 г. Чип будет изготовлен на базе 45-нм технологии с применением формулы транзисторов hi-k. Число транзисторов – 2,3 млрд. Первые системы на базе Nehalem-EX ожидаются в начале 2010 г.
• 1 июня 2009 г. – компания AMD объявила о начале поставок 6-ядерных серверных процессоров Opteron (кодовое название Istanbul)для систем с двумя, четырьмя и восемью процессорными гнездами. По данным AMD, 6-ядерные процессоры примерно на 50% быстрее по сравнению с серверными процессорами с четырьмя ядрами. Istanbul будет конкурировать с 6-ядерными процессорами Intel Xeon под кодовым названием Dunnington, появившимися в продаже в сентябре 2008 г. Процессор изготавливается с использованием 45-нм технологии, работает на частоте 2,6 ГГц и обладать 6МБ кэш-памяти третьего уровня.
• 9 сентября 2009 г. – Intel представила новые процессоры – Core i7-860 (2,8 ГГц) и Core i7-870 (2,93 ГГц) с возможностью повышения тактовой частоты до 3,46 и 3,6 ГГц соответственно (технология Intel Turbo Boost). Чипы обладают кэш-памятью объемом 8МБ и интегрированным 2-канальным контроллером оперативной памяти DDR3-1333. Каждый из представленных 4-ядерных процессоров Core i7 может распознаваться системой как 8-ядерный благодаря технологии Hyper-Threading. Кодовое название чипов – Bloomfield, архитектура – Nehalem, техпроцесс – 45 нм.
• 22 сентября 2009 г. – компания AMD заявила о намерении выпустить первые 6-ядерные центральные процессоры для ПК. Новинки будут базироваться на 6-ядерной архитектуре серверных процессоров AMD Opteron Istanbul, их кодовое обозначение – Thuban. Как и серверные процессоры Istanbul, Thuban будут представлять собой устройства на основе единого кристалла, при этом изготовление интегральных микросхем будет осуществляться по 45-нм техпроцессу. 6-ядерные процессоры, как и их серверные аналоги, будут состоять из 904 млн. транзисторов, при этом площадь микросхемы составит 346 кв. мм. Предположительно, на рынке процессоры появятся под брендом AMD Phenom II X6.
Примечания
1. Кодовое название (обозначение, наименование) – это название ядра процессора.
2. Линейка – это модельный ряд процессоров одной серии. В рамках одной линейки процессоры могут значительно отличаться друг от друга по целому ряду параметров.
3. Чип (англ. chip) – кристалл; микросхема.
4. Под технологическим процессом (техпроцесс, технология, технология производства микропроцессоров) подразумевается размер затвора транзистора. Например, когда мы говорим – 32-нм технологический процесс, – это означает, что размер затвора транзистора составляет 32 нанометра.
5. Канал – это область транзистора, по которой проходит управляемый ток основных носителей заряда.
Исток – это электрод транзистора, из которого в канал входят основные носители заряда.
Сток – это электрод транзистора, через который из канала уходят основные носители заряда.
Затвор – это электрод транзистора, служащий для регулирования поперечного сечения канала.
6. Фактически, транзисторы – это миниатюрные переключатели, с помощью которых реализуются те самые «нули» и «единицы», составляющие основу цифровой информации. Затвор предназначен для включения и выключения транзистора. Во включенном состоянии транзистор пропускает ток, а в выключенном – нет. Диэлектрик затвора расположен под электродом затвора. Он предназначен для изоляции затвора, когда ток проходит через транзистор.
Более 40 лет для изготовления диэлектриков затвора транзистора использовался диоксид кремния (благодаря легкости его применения в массовом производстве и возможности постоянного повышения производительности транзисторов за счет уменьшения толщины слоя диэлектрика). Специалистам Intel удалось уменьшить толщину слоя диэлектрика до 1,2 нм (что равнозначно всего 5 атомарным слоям!) – такой показатель был достигнут в 65-нанометровой технологии производства.
Однако дальнейшее уменьшение толщины слоя диэлектрика приводит к усилению тока утечки через диэлектрик, в результате чего растут потери тока и тепловыделение. Рост тока утечки через затвор транзистора по мере уменьшения толщины слоя диэлектрика из диоксида кремния является одним из самых труднопреодолимых технических препятствий на пути следования закону Мура. Для решения этой принципиальной проблемы корпорация Intel заменила диоксид кремния в диэлектрике затвора на тонкий слой из материала high-k на основе гафния. Это позволило уменьшить ток утечки более чем в 10 раз по сравнению с диоксидом кремния. Материал high-k диэлектрика затвора несовместим с традиционными кремниевыми электродами затвора, поэтому в качестве второй составляющей «рецепта» Intel для ее новых транзисторов, создаваемых на основе 45-нанометрового техпроцесса, стала разработка электродов с применением новых металлических материалов. Для изготовления электродов затвора транзистора применяется комбинация различных металлических материалов.
7. Приведенная в статье хронология создания многоядерных процессоров не претендует на всеобъемлющий охват.



