Процессор для всех-2. AMD vs Intel – осень-2007

Сегодня мы продолжаем решать проблему выбора оптимального процессора для решения повседневных задач. Вторая часть статьи посвящена непосредственному тестированию (теорию см. в «МБ» №45’2007).

3×3
После изучения рынка было решено протестировать сразу шесть процессоров в трёх ценовых категориях:
Athlon 64 X2 6000+ против Core 2 Duo E6550 (~5000 руб.);
Athlon 64 X2 5200+ против Core 2 Duo E4400 (~3600 руб.);
Athlon 64 X2 4200+ против Pentium E2160 (~2200 руб.).
Разница в цене между категориями составила 1400 рублей, чего, на наш взгляд, вполне достаточно для причисления этих процессоров к разным классам по назначению. С подробными характеристиками данных CPU вы можете ознакомиться в таблице №1.

20080212_table1.jpg
Таблица 1. Технические характеристики процессоров

Также есть смысл рассказать некоторые подробности и причины такого подбора конкурентов:
1. В ценовой категории «более $200», как уже было сказано выше, AMD нечего противопоставить процессорам Intel, поэтому в качестве конкурента почти топовому Athlon 64 X2 6000+ был выбран именно Core 2 Duo E6550 – грозный соперник, работающий на FSB 1333 МГц (E6420 при почти такой же цене заведомо слабоват). Стоит отметить, 6000+ – это процессор, имеющий, по сути, заводской разгон, так как для повышения стабильности на частоте 3 ГГц напряжение ядра поднято на 0,1 В и составляет примерно 1,45 В.
2. Athlon 64 X2 5200+ многими считается самым оптимальным процессором на платформе AMD K8, по причине наличия полноценного кэша L2 в 1 Мбайт на каждое ядро, относительно высокой частоте в 2,6 ГГц и тепловыделении в 89 Вт, против 125 Вт у 6000+ (правда, если на прилавках в скором времени не появится упомянутый в первой части статьи 5000+ Black Edition). В соперники ему был выбран также популярный E4400, обладающий «удобным» для разгона множителем x10.

20080212_black.jpg

3. Так как E2180 пока всё же дороговат, выбор пал на E2160 – а вот над выбором соперника пришлось подумать. От использования ядра Brisbane решено было отказаться – ввиду уже упомянутых его недостатков, поэтому выбор пал на модель 4200+ Energy Efficient на ядре Windsor-512 с пониженным напряжением.
А вот от сравнительных тестов в разгоне решено было отказаться: даже бюджетный Pentium E2160 при переходе рубежа в 3 ГГц становится недосягаем для A6000+, который, собственно, и гнать-то некуда. Хотя, забегая вперед, скажем, что тесты на разгон всё же были сделаны, хоть и в несколько сокращённом варианте.

Как это было
Конфигурацию тестовых стендов вы можете посмотреть во врезке. Поясним некоторые детали.
Для достижения высоких результатов используемая память DDR2-800 от OCZ работала на сниженных таймингах 4-4-4-11 при напряжении 2,2 В, но для тестируемых платформ всё же были некоторые различия: на системе Socket AM2 частота памяти, ввиду всё тех же особенностей реализации встроенного контроллера (целый делитель относительно полной тактовой частоты), была всегда ниже 800 МГц. Конкретные значения: A4200+ – 737 МГц (CPU/6), A5200+ – 746 МГц (CPU/7), A6000+ – 753 МГц (CPU/8). На платформе Intel частота памяти всегда была равной 800 МГц, но параметр Command Rate, в отличие от AMD, был выставлен как 2T (на частоте 800 МГц используемая память его просто не потянула), что, по идее, должно нивелировать отрыв по тактовой частоте.

Конфигурация тестовых стендов
Материнская плата (LGA 775) – ASUS P5K SE (P35)
Материнская плата (Socket AM2) – EPoX EP-MF4-J3 (nForce4)
Оперативная память – 2×1024 Мбайт DualDDR2-800 OCZ Gold Edition XTC
Видеокарта – Albatron GeForce 8600 GT 256 Mбайт
Звуковая карта – Creative SB X-Fi XtreamGamer
Жёсткий диск – WD Caviar SE 120 ГБ 7200 SATA-II
Системы охлаждения – Thermaltake BigTyphoon и Zalman CNPS9700 LED
Блок питания – Thermaltake PurePower 460 Вт
ПО – Microsoft Windows XP SP2, NVIDIA Forceware 162.18

Чипсет nForce 4 работал с шиной HyperTransport в полноскоростном режиме 1000 МГц с множителем х5, несмотря на то что не являлся Ultra-версией.
Температурный мониторинг не производился по причине явно заниженных показаний температуры CPU на плате ASUS P5K SE (27°С при полной загрузке процессора и комнатной температуре в 24°С!), а делать замеры только для платформы AMD смысла не было. К тому же, для охлаждения сегодня использовались суперкулеры, входящие в десятку лучших в мире, так что за перегрев испытуемых можно было не переживать. В качестве термоинтерфейса во всех случаях использовалась отечественная термопаста АлСил-3.
Все без исключения тесты, которыми мы нагружали CPU, в той или иной степени оптимизированы под многопоточность, поэтому, собственно, и тестов получилось немного.
Синтетические:
Lavalys Everest 4.00 – встроенные тесты PhotoWorxx (сложная комплексная обработка изображения высокого разрешения, один прогон) и ZLib (использует одноимённую библиотеку сжатия, задействует только базовые инструкции x86, два прогона).
CPU RightMark Lite Benchmark Suite 2005 – тесты №1 и №3, настройки по умолчанию, разрешение 800×600 (расчёт физической модели и рендеринг её в реальном времени средствами центрального процессора).
PerformanceTest 6.0 – комплексный тест, использовалась лишь его часть, предназначенная для бенчмаркинга CPU.
Видео и архивация:
7-Zip 4.55b – архивирование папки с файлами разного размера общим объёмом 450 Мбайт, степень сжатия «Ultra». Результат в секундах, меньше – лучше.
WinRAR 3.71 – архивирование папки с файлами разного размера общим объёмом 450 Мбайт, степень сжатия «Максимум», архив непрерывный. Результат в секундах, меньше – лучше.
DivX 6.6.1 – кодирование в VirtualDub несжатого видеофрагмента объёмом 1,23 Гбайт с преобразованием в разрешение 640×480 посредством фильтра Lanczos3. Настройки кодека: 3000 kbps, Home Theatre, Insane Quality. Звуковой поток сжимался в MP3, 128 Кбит/c CBR, кодеком Lame. Результат в секундах, меньше – лучше.
Игровые тесты:
3DMark06 1.0.2 – популярнейший бенчмарк, содержит два тяжёлых теста CPU. Настройки по умолчанию, разрешение 1024×768.
Quake 4 1.3 – жадная до ресурсов центрального процессора игра, для дополнительной разгрузки видеокарты использовалось разрешение 640×480, настройки детализации – «High» (не «Ultra»!). Результат записывался после двойного прогона демо-ролика собственного изготовления.
К сожалению, пришлось ограничиться только двумя игровыми тестами, хотя изначально планировалось использовать ещё S.T.A.L.K.E.R. – Shadow of Chernobyl, Call of Juarez, Test Drive Unlimited, Serious Sam 2, Call of Duty 2. От некоторых пришлось отказаться по причине очень большого разброса результатов на одном и том же процессоре (CoD 2, SS 2, TDU), от других – по причине малой процессорозависимости: в них необходимо создавать специальные тесты, способные нагрузить процессор обработкой физики и AI, а простая геймплейная «пробежка» не даёт такой возможности. Зато Quake 4 оказался весьма достойным тестом, так как имеет хорошую чувствительность к тактовой частоте, объёму кэша L2, пропускной способности шины, латентности памяти и в то же время – высокую повторяемость результатов. Так что, в какой-то мере, по результатам, полученным в этой игре, можно в целом судить о скорости процессоров в игровых приложениях.

Результаты
Все результаты, полученные в ходе тестов шести процессоров в номинальных режимах, сведены в таблицу №2 попарно для каждой пары CPU.

20080212_table2.jpg
Таблица 2. Результаты тестирования

Поясним результаты.
В тесте PhotoWorxx системы AMD получают большое преимущество благодаря Command Rate 1T, но даже если исключить этот и другие синтетические тесты из рассмотрения, то картина для всех трёх пар процессоров получается практически одинаковой – в реальных приложениях лидируют процессоры от AMD! Исключение составляет лишь кодек DivX, традиционно более благосклонный к процессорам Intel – так что людям, часто занимающимся сжатием больших объёмов видеоданных в этот популярный формат, процессоры на архитектуре Intel Core строго рекомендованы. В играх же, как в самой популярной в настоящее время работе для CPU, лидерство AMD на базовых частотах очевидно. Лишь Core 2 Duo E6550 – за счёт своей «внедорожной» шины 1333 МГц – смог немного обойти Athlon 64 X2 6000+ в Quake 4. Констатируем также: Pentium E2160 на номинальной частоте как игровой процессор слишком слаб. Приятно отметить, что наиболее уверенно преимущество AMD выглядит в популярном среднем классе – отрыв в тактовой частоте здесь составляет 600 МГц не в пользу Intel. В наиболее заслуживающем доверия синтетическом тесте CPU RightMark так же наблюдаем лидерство AMD.
Итог на номинальных частотах. Явное преимущество AMD в низко- и среднеценовом диапазоне, за исключением работы с кодеком DivX. Между Core 2 Duo E6550 и Athlon 64 X2 6000+ разница уже невелика, но по?прежнему не в пользу Intel. Лучшей покупкой по соотношению цены и производительности является Athlon 64 X2 5200+.

Overclocking
Не использовать на практике огромный разгонный потенциал процессоров Intel Core – это преступление. Понимая, что при разгоне игра пойдёт исключительно в ворота Intel, мы решили разогнать лишь процессоры из нашего верхнеценового сегмента. Athlon 64 X2 6000+ представлял интерес для оценки возможностей разгона топовой модели компании, а Core 2 Duo E6550 – как процессор с широкой шиной и низким множителем: это – в теории – для оверклокинга неблагоприятно, но посмотреть, как покажет себя процессор в деле, было любопытно.
Оба процессора удалось разогнать до частоты 3,4 ГГц, что сделало соревнование ещё интереснее: при желании можно рассчитать разницу в производительности на 1 МГц.
Правда, разгон E6550 упёрся в память: понижающих делителей на шину памяти современные чипсеты Intel не имеют, так что соотношение FSB:DRAM получилось равным 1:1, при впечатляющей частоте FSB – 1943 МГц! Зато это позволило на всю катушку задействовать возможности двухканальной DDR2. Её частота составила 971 МГц при таймингах 5-5-5-15-2T, что заметно быстрее чем 757 МГц (CPU/9) на системе о AMD, хоть и при более низких таймингах 4-4-4-11-1T. Множитель шины HyperTransport был понижен до х4, итоговая частота составила 907 МГц. Проверка систем на стабильность производилась программой Prime95.
Результаты в разгоне. К сожалению, игровые тесты на A6000+ не были проведены из-за нехватки времени, но, думаем, и без них всё понятно. Как говорится: «no comments». Результаты – в таблице №3.

20080212_table3.jpg
Таблица 3. Результаты в разгоне

Любителям побрюзжать о малой выгоде оверклокинга мы рекомендуем сравнить результаты E6550 до и после разгона. При разгоне младших моделей процессоров отрыв Intel будет не меньшим или даже увеличится, так как младшие Athlon 64 X2 редко переходят рубеж в 3 ГГц, в то время как частоты 3,2-3,4 ГГц покоряют почти все процессоры семейства Conroe.

Кэш-зависимость
Наверное многие задавались вопросом, так ли нужен большой объём кэш-памяти второго уровня процессору и насколько его уменьшение критично для реальных приложений.
Многочисленные исследования, результаты которых несложно найти в Интернете, говорят о том, что для процессоров на ядре Conroe наиболее критичен переход от 2 Мбайт к 1 Мбайт кэша L2, причём больше всего страдает скорость игр. Переход от 4 Мбайт к 2 Мбайт тоже сильно влияет на производительность некоторых приложений, но их число меньше (в основном, это научные вычисления и работа с базами данных). В рамках этого обзора мы оценили падение производительности именно для первого случая, понизив у Core 2 Duo E4400 множитель на х1, превратив в E4300 и тем самым сравняв его с Pentium E2160 по всем параметрам, кроме объёма кэша L2.
Для процессоров на архитектуре K8, как уже давно известно, объём кэша L2 не слишком важен – отличия, опять же, наиболее заметны в играх. По крайней мере, так было на одноядерных CPU. Как обстоят дела на двухъядерном фронте и стоит ли гоняться за полноценным ядром Windsor, мы решили узнать, снизив у Athlon 64 X2 5200+ множитель с х13 до х11, превратив его в A4200+ c мегабайтным кэшем на каждое ядро или, другими словами, в серийный A4400+ (90 нм). Тесты проведены по прежней методике, результаты – в таблице №4.

20080212_table4.jpg
Таблица 4. Зависимость производительности от объёма кэша

Комментарии к результатам. Как это ни странно, все синтетические тесты почти равнодушны к уменьшению объёма кэша вдвое на обеих платформах, а в PhotoWorxx скорость даже падает. Так же мала разница в DivX. Зато в архивировании и в играх быстродействие, как и ожидалось, снизилось, но всё же не настолько, чтобы это можно было счесть критичным и переплатить около 1200 рублей за E4300 вместо E2160. А что касается K8, то тут переплата за полноценный Windsor, как правило, невелика, но так как младшие модели на нём уже сняты с производства, то и найти их будет уже весьма проблематично. В итоге, из старших моделей предпочтительно всё же брать процессоры с кэшем L2 2×1 Мбайт, а при покупке младших заострять на этом параметре внимание уже не стоит. Также нельзя не отметить, что Athlon 64 X2 4200+ уверенно конкурирует с намного более дорогим Core 2 Duo E4300 и в некоторых тестах даже оказался быс-трее.

Работа с памятью
Напоследок продемонстрируем эффективность работы процессоров с кэшем L2 и памятью и отметим узкие места. Измерения проводились с помощью утилиты Lavalys Everest 4.00 (Cache & Memory Benchmark). Результаты – в таблице №5.
Платформа Intel. Узким местом является пропускная способность системной шины: даже при частоте 1333 МГц она эквивалентна лишь двухканальной DDR2-667, а в случае с FSB 800 МГц задействуется только половина пропускной способности DualDDR2?800. Лишь при разгоне можно сблизить эти значения. В результате, на современной платформе Intel имеет гораздо больший смысл уменьшать латентность памяти, понижая тайминги при неизменной частоте (или повышать её при зафиксированных таймингах), чем добиваться абсолютных высокочастотных рекордов. В любом случае (а в случае разгона – тем более) использование качественной «оверклокерской» памяти рекомендуется. Обратите внимание на возрастающие задержки кэша L2 с увеличением его объёма – это основная причина, по которой кэш не делают слишком большим.
Платформа АМD. На первый взгляд, при использовании интегрированного в процессор контроллера памяти (IMC, Integrated Memory Controller) узких мест быть не должно. Однако могли ли инженеры AMD предполагать, выпуская в 2003 году процессор Athlon 64 (Socket 754) с поддержкой одноканальной DDR333, что прогресс в развитии DRAM будет столь серьёзным? Обратите внимание: при использовании двухканальной DDR2-800 теоретическая пропускная способность её будет равна 12800 Мбайт/с, что зачастую больше, чем реальная пропускная способность кэша L2 (в зависимости от частоты CPU). Прибавив сюда «накладные расходы» самого контроллера памяти при передаче данных в кэш и обратно, мы получим в итоге пиковые значения порядка 9-10 Гбайт/с для самых высокочастотных моделей процессоров и самой низкой по задержкам DDR2-800. Другими словами, потенциал IMC процессоров поколения K8 себя полностью исчерпал и для перехода на DDR2-1066 и DDR3 требуется полная его переработка, что, будем надеяться, уже сделано в K10. Впрочем, по абсолютным показателям Hammer IMC всё ещё превосходит «классическую» схему Intel.

Заключение
Сделаем окончательные выводы по выбору оптимального двухъядерного процессора для домашнего ПК.
Если разгон не планируется, золотой серединой является Athlon 64 X2 5200+. Если требуется ещё более бюджетное решение, то можно взять модель с рейтингом 4600+ или 4200+. При выборе между Athlon 64 X2 6000+ и Core 2 Duo E6550 процессор от Intel всё же смотрится предпочтительнее из-за вдвое меньшего тепловыделения. Из более производительных решений наилучшим вариантом будет Core 2 Duo E6750 (2,66 ГГц, FSB 1333).

20080212_amd_intel_1.jpg

Для разгона оптимальным решением будет приобретение Core 2 Duo E4400. Из бюджетного сектора наиболее выгоден Pentium E2160, а для мощных игровых ПК лучшим выбором также будет Core 2 Duo E6750. Фанатам AMD можно посоветовать подождать появления в реальной продаже Athlon 64 X2 5000+ Black Edition.

Выражаем благодарность КЦ «Техпром» (ул. Московская, 12) и магазину «Эксперт Компьютерс» (ул. Воровского, 151) за предоставленные для тестирования процессоры, комплектующие тестовых стендов и всестороннюю техническую поддержку.

Рекомендуем почитать: