AMD Athlon64: какой выбрать?

Вернемся в далекие 80-е годы, когда общественности был представлен процессор i386 — первый процессор, использующий 32-бит архитектуру x86. Но по сути, это был последний «революционный» процессор. С тех пор развитие происходило только за счет, так сказать, «приклеивания» новых инструкций. Первым таким процессором был Intel Pentium MMX. До архитектуры AMD64 все развитие велось именно в этом направлении, а с появлением K8 развитие пошло не вширь, а вглубь. Поэтому все меньше остается злых языков, играющих в Нострадамуса и пророчащих этой архитектуре гибель. Но ближе к делу — к процессорам компании AMD.

Не так давно закончилась эпопея процессоров линейки К7 — AthlonXP. Компания AMD официально прекратила поставки этого процессора. Заменой стала линейка K8. Хотя процессоры этой линейки выпускаются уже чуть более двух лет, в Кирове они появились совсем недавно.
Представителей этого семейства набралось уже немало. AthlonFX — исключительно игровой процессор, Athlon64 — «рабочая лошадка» в двух вариантах (для Socket754 и для Socket939). Opteron — процессор для рабочих станций и серверов (практически та же ситуация; точнее, в скором времени будут представлены младшие двухъядерные модели Opteron на разъеме, использующем нерегистровую память DDR, — Socket 939). Также у AMD с недавних пор появилась торговая марка Sempron, аналог Intel Celeron. Стоит отметить и Athlon64 X2, ориентированный на настольный сегмент рынка ($1000 за процессор?!), но когда он появится в розничной продаже по приемлемой цене — остает­ся загадкой. Поэтому спустимся с небес в материальный мир и сравним два процессора, одинаковые по рейтингу, но на различных разъемах.

AMD64 изнутри
Для начала разъясним некоторые особенности процессоров с микроархитектурой AMD64 (см. блок-схему).
Контроллер памяти. Как известно, самым узким местом в системе всегда остает­ся подсистема памяти. AMD выбрала весьма оригинальный способ увеличения производительности — встроить контроллер памяти прямо в ядро. Контроллер памяти характеризуется несколькими параметрами: ширина шины данных, частота синхронизации и задержки, возникающие при работе процессор – контроллер памяти.

Для начала ответим на вопрос: чем характеризуется скорость работы памяти? Первое — это частота, второе — это ширина шины данных. Таким образом, в идеаль­ных условиях при использовании DDR400 пропускная способность составит 3.2 Гбит/с для одноканального контроллера и 6.4 Гбит/с для двухканального соответственно.
Использование интегрированного контроллера памяти позволило системам на AMD64 вплотную приблизиться к значениям систем с архитектурой NetBurst, а именно: при внедрении контроллера в ядро задержки стали примерно в 2.5 раза ниже по отношению к использованию внешнего собрата.
Шина HyperTransport. Впервые с этой шиной мы столкнулись при появлении набора системной логики nForce2. Правда, есть одно «но». В nForce/nForce2 использование этой шины сводилось к понятию «очень быстрая PCI», не более. Сегодня мы можем говорить о развертывании этой шины в полную силу. Благодаря этой технологии обеспечивается связь как между отдельными узлами процессора, так и с внешними устройствами. Кстати, технология HT (не подумайте, что это Hyper-Threading) очень схожа по многим параметрам с PCI-E. Например, у них одинаковый механизм формирования запроса, одинаковые методы контроля «на лету», обе поддерживают переключение трафика и передачу данных «точка-точка».
Чипсет. Стандартная организация набора системной логики выглядит следующим образом. Микросхема, называемая «северный мост» (NorthBridge) управляет всем самым необходимым: контролирует обмен информацией устройств с памятью, то есть имеет внутри сам контроллер, различные шины: PCI, AGP и еще что-нибудь. Другая микросхема, называемая «южный мост» (SouthBridge), содержит контроллеры, управляющие устройствами ввода-вывода. Между южным и северным мостами связь осуществляется через некую шину, выбор которой ограничивается только фантазией разработчиков. Кто-то использует обычную PCI, кто-то — PCI 64bit. AMD выбрала свой путь. Связь между узлами системы осуществляется за счет самой быстрой на сегодняшний день шины — HyperTransport. Причем самые «трудные» части логики, такие как контроллер памяти и часть контроллера AGP — GART, были изъяты из микросхемы северного моста и помещены в ядро. Можно только сказать: «Браво, AMD!»

Новые инструкции и технологии. Посредством кросс-лицензии AMD приобрела набор инструкций SSE2. (В последнем из вышедших одноядерных процессоров — и SSE3. Тестирование этого процессора будет проведено при доступности его в Кирове.) Напомню, что кросс-лицензия представляет собой типичный бартер. Что AMD отдала взамен — неясно; полагаю, технологию защиты от переполнения буфера. Весьма занятная фишка, особенно для тех, кто находится постоянно в Сети.
В K8 появилась технология Cool and Quiet (C'n'Q), которая является полноправной наследницей Bus Disconnect и позволяет снизить энергопотребление, а следовательно и тепловыделение.
Новые процессоры имеют 64-бит набор инструкций, необходимость которого для рядового пользователя не особо ярко выражена, так как адресация большого количества памяти для массовых нужд не требуется. Но для тех, кто постоянно работает в CAD, этот параметр является весьма существенным.
Усовершенствования. Само ядро в плане организации узлов и их количества не подверглось существенным изменениям и точно так же, как в AthlonXP, содержит девять функциональных блоков (3 ALU, 3 AGU, FADD, FMUL и FMISC — три целочисленных блока и три блока операций с плавающей запятой), а также три декодера x86, тщательно проработанных AMD. Но модификации подвергся блок предсказания ветвлений. Счетчик переходов возрос с 4000 до 16000 вхождений. Это, например, яв­ляется очень критичным при работе с СУБД и расчете искусственного интеллекта в играх. Целочисленный конвейер возрос до 12 ступеней. Стоит отметить, что вдвое возросла скорость обмена данными между кэшами L1 и L2.

Образцы процессоров
Перечислив особенности, перейдем к самим процессорам. Для достоверности тестирования были взяты однорейтинговые процессоры, выполненные под различные разъемы.
Первый участник тестирования — Athlon64 3000+, использующий 754-пиновый разъем. Чип построен на ядре Newcastle, которое выполнено с использованием 130-нм техпроцесса и имеет одноканальный интегрированный контроллер памяти. Рабочее напряжение 1.5 В. Частота процессора равна 2000 МГц. Кэш L1 составляет 64/64 Кбайт Data/code; кэш второго уровня — всего 512 Кбайт. Набор инструкций стандартен для всей линейки K8: MMX, SSE, SSE2, X86-64, 3Dnow!. Если сказать правдиво, немного забегая вперед, по многим параметрам процессор выглядит весьма прилично. Конечно, огрехи есть, но это те недостатки, которые решаются очень просто. Например, процессор на данной ревизии чипа является чуть ли не самым горячим из всей линейки. Хотя, конечно, это не Prescott, и в режиме со 100% нагрузкой при использовании обычного алюминиевого кулера температура не поднимется выше отметки 50° С.
Второй попавший мне в руки процессор построен на ядре Winchester. Его частота оказалась на 200 МГц ниже, чем у однорейтингового Newcastle с одноканальным контроллером памяти. Процессор выполнен по 90-нм техпроцессу. Оверклокеры, возьмите на заметку!

Тестирование
Результаты тестирования мы свели в таблицу. Как видим, процессоры в целом равны. Но все же наблюдается некоторый перевес в сторону Newcastle. Почему так получилось? Давайте разберемся.

Sisoftware Sandra 2004
Как было сказано ранее, в Athlon64 столько же функциональных блоков (3 ALU, 3 AGU, FADD, FMUL и FMISC), поэтому особо ждать прироста не приходилось.
Если сравнить с равночастотным AthlonXP, получились бы практически те же самые значения.
Если сравнить только эти два процессора между собой, то можно резюмировать, что скорость обработки информации зависит только от частоты ядра.

AIDA 32
В операциях чтения из памяти двухканальный контроллер памяти дал нам более чем 50% прироста, а в записи — более 70%. Вспомним, какой прирост давала система на двухканальном nForce2 — 5-10%. По сравнению с полученными значениями — смешно.

Virtual Dub DivX 511
Для тестирования был взят кусок несжатого видеофайла размером около 3.2 Гбайт. Как видно по таблице, результаты равны (шесть секунд проигрыша спишем на погрешность измерений).
Как известно, производительность системы при кодировании данных складывается из следующих факторов: частота ядра; объем кэша; выбор компилятора (в нашем случае это несущественно, так как были выбраны практически одинаковые процессоры); доступ к памяти. Из тестов явно видно, что 512 Кбайт кэша для работы “в полную силу” контроллеру памяти катастрофически не хватает. Не может такого быть, чтобы в операциях такого рода контроллер памяти занимал последнее место.

WinRar
В тесте архивировался файловый пакет объемом 322 Мбайт. Как и в случае кодирования, никаких сюрпризов. Те же самые результаты, а следовательно — и выводы.

3D Mark '03
Данный тест, хотя и не отображает полную картину происходящего, но делает комплексную оценку, что немаловажно.

Температурные режимы процессоров
Хотя чипы и имеют не настолько различную частоту (хотя для процессоров AMD этот критерий очень важен), но упускать из виду тот факт, что они выполнены по разным техпроцессам, нельзя.
Энергопотребление у Winchester оказалось ниже, чем у Newcastle; а следовательно, и температурный режим — более щадящий. При использовании стандартного кулера от AVC (на мой взгляд, отличного во всех отношениях) температура при 100% нагрузке оказалась на 10-12°С ниже, чем у Newcastle, — при том, что Newcastle охлаждал Igloo 7200, отличающийся куда лучшими характеристиками.

Выводы
Оба процессора показали себя с лучшей стороны, проявив почти равную производительность в различных тестах. Единственно, не стоит покупать систему на базе процессора под Socket754, если вы планируете апгрейд через год, так как в этом случае вам придется покупать и новую материнскую плату, да и процессор выше 3700+ вы не найдете — его участь предрешена уже давно. Поэтому стоит обратить внимание на более перспективную платформу — Socket939. Нет смысла покупать Socket754 и по соображениям экономии. Цены на эти процессоры в Кирове практически сравнялись.


Рекомендуем почитать: