Студопедия

КАТЕГОРИИ:

АвтоАвтоматизацияАрхитектураАстрономияАудитБиологияБухгалтерияВоенное делоГенетикаГеографияГеологияГосударствоДомЖурналистика и СМИИзобретательствоИностранные языкиИнформатикаИскусствоИсторияКомпьютерыКулинарияКультураЛексикологияЛитератураЛогикаМаркетингМатематикаМашиностроениеМедицинаМенеджментМеталлы и СваркаМеханикаМузыкаНаселениеОбразованиеОхрана безопасности жизниОхрана ТрудаПедагогикаПолитикаПравоПриборостроениеПрограммированиеПроизводствоПромышленностьПсихологияРадиоРегилияСвязьСоциологияСпортСтандартизацияСтроительствоТехнологииТорговляТуризмФизикаФизиологияФилософияФинансыХимияХозяйствоЦеннообразованиеЧерчениеЭкологияЭконометрикаЭкономикаЭлектроникаЮриспунденкция

Гибридная архитектура (SUMA)




Pentium M

Представленный в марте 2003 года, Pentium M это процессор с архитектурой x86, разработанный и произведённый компанией Intel и предназначенный для использования в платформе Intel Centrino. Процессор разрабатывался для использования в мобильных компьютерах, о чём говорит буква "M", mobile. Перед официальным представлением широкой публике он носил кодовое имя "Banias". Pentium M представляет собой новую и радикальную отправную точку Intel, он не является доработанной, с целью снижения потребления энергии, версией процессора для настольного компьютера Pentium 4, а представляет собой очень сильно доработанную версию процессора Pentium III на ядре Tualatin, который, в свою очередь, базировался на дизайне ядра Pentium Pro. Он специально оптимизирован с целью увеличения энергетической эффективности, жизненно необходимой характеристики для продления времени работы мобильных компьютеров от батареи. Работая с очень малым средним потреблением энергии и, соответственно, малым тепловыделением, по сравнению с настольными процессорами, Pentium M также работает и на малых тактовых частотах, но со сравнимой производительностью.

Процессор представляет собой вычислительное ядро от Pentium III, системную шину, совместимую с Pentium 4, усовершенствованные инструкции декодирования/выдачи, улучшенный блок предсказания переходов, поддержку SSE2 и большой кэш. Используется также новейший метод отключения неиспользуемых энергоёмких блоков кэша. Другой метод энергосбережения включает в себя динамическое изменение частоты и напряжения ядра. Эти свойства Pentium M позволили добиться экстремально низкого энергопотребления, варьирующегося от 5 Вт до 27 Вт при полной нагрузке, что сильно востребовано производителями мобильных компьютеров и позволяет использовать Pentium M в тонких, лёгких и маленьких ноутбуках.

Процессоры Pentium M получили широкое распространение в индустрии встраиваемых систем. Низкое потребление Pentium M позволяет строить безвентиляторные и высокоинтегрированные встраиваемые компьютеры, такие как "Midget" компании Toradex.

Первый Pentium M, который носил кодовое имя Banias без номеров моделей, производился с использованием 130нм техпроцесса, имел частоты от 1.3 ГГц до 1.7 ГГц. Затем Intel представил улучшенный Pentium M, также известный как Dothan, 10 мая 2004 года. Процессор Dothan Pentium M является первым процессором Intel, для идентификации которого использовался так называемый «процессорный номер», который является более предпочтительным, чем стандартный, основанный на значениях тактовых частот.

В июле 2005 года Intel представил 2 новые модели: 780 (2,26 ГГц) и низковольтную 778 (1,60 ГГц).

Следующее поколение процессоров, использующий микроархитектуру Pentium M (кодовое имя Yonah), которые представлены под новой торговой маркой Intel Core, как Core Solo и Core Duo.

Многоядерный процессор.

Многоядерный процессор — центральный процессор, содержащий два и более вычислительных ядра на одном процессорном кристалле или в одном корпусе.

Многоядерный процессор позволяет работать в многозадачных средах с одновременным выполнением нескольких активных и фоновых приложений, повысить эффективность и снизить энергопотребление при одновременном запуске множества приложений, увеличить количество пользователей, работающих одновременно на одном ПК. Многоядерные процессоры обеспечивают более высокую производительность для потоковых приложений.

Многоядерные процессоры отражают тенденцию последних лет: производительность компьютеров постоянно повышается и вместе с тем уменьшается потребляемая мощность.

[Производительность] = [Тактовая частота] x [Количество инструкций, выполняемых за один такт]

В приложениях, оптимизированных под многопоточность, наблюдается прирост производительности на многоядерном процессоре. Однако, если приложение не оптимизировано, то оно не будет получать практически никакой выгоды от дополнительных ядер, а может даже выполняться медленнее, чем на процессоре с меньшим количеством ядер, но большей тактовой частотой. Это в основном приложения, разработанные до появления многоядерных процессоров, либо приложения, в принципе не использующие многопоточность.

На сегодняшний день основными производителями процессоров — Intel и AMD дальнейшее увеличение числа ядер процессоров признано как одно из приоритетных направлений увеличения производительности.

Многядерные процессоры Intel

Уже к 1994 г. в процессоре Intel Pentium был реализован параллелизм на уровне команд - архитектурная особенность, при которой команды одного потока кода извлекаются, выполняются параллельно, а затем объединяются в прежнем порядке. В 1994 г. корпорация реализовала также двухпроцессорную обработку (два полноценных процессора, вставлялись в два разъема системной платы), создав аппаратную многопоточную среду для серверов и рабочих станций. В 1995 г. был представлен процессор Pentium Pro, поддерживавший эффективное объединение уже четырех процессоров на одной системной плате, что обеспечило более высокую скорость обработки данных в многопоточных приложениях, ориентированных на серверные платформы и рабочие станции.

Эти усилия стимулировали разработку однопроцессорных технологий, обеспечивающих более высокую степень параллелизма на уровне потоков, для массовых платформ. Корпорация реализовала технологию HT (Hyper-Threading) для процессоров Pentium 4 и Xeon, как инновационный способ достижения более высокой степени параллелизма на уровне потоков в процессорах для массовых систем. В корпорации поняли, что технология HT естественным образом ведет к разработке многоядерных процессоров, отличающихся более высокими степенями параллелизма. Для перевода своей полупроводниковой индустрии на выпуск многоядерных процессоров с 2000 г. Intel вложила большие средства в исследования и разработки по этой тематике. В Intel не считают целесообразным конструировать многоядерные процессоры, состоящие из одного ядра общего назначения и специализированных ядер. Применение универсальных ядер, способных решать самые различные задачи считается более перспективным.

При создании многоядерных процессоров для настольных ПК микропроцессорный гигант предпочел пойти на первых порах по пути "наименьшего сопротивления", продолжив традиции создания привычных для себя SMP-систем с общей шиной. Выглядит подобная MP-система чрезвычайно просто: один чипсет, к которому подключается вся оперативная память, и одна процессорная шина, к которой подключены все процессоры. Никакой общей схемотехники у этих ядер нет.

SMP архитектура

SMP архитектура (symmetric multiprocessing) - cимметричная многопроцессорная архитектура. Главной особенностью систем с архитектурой SMP является наличие общей физической памяти, разделяемой всеми процессорами.

Память является способом передачи сообщений между процессорами, при этом все вычислительные устройства при обращении к ней имеют равные права и одну и ту же адресацию для всех ячеек памяти. Поэтому SMP архитектура называется симметричной. Последнее обстоятельство позволяет очень эффективно обмениваться данными с другими вычислительными устройствами. SMP-система строится на основе высокоскоростной системной шины (SGI PowerPath, Sun Gigaplane, DEC TurboLaser), к слотам которой подключаются функциональные блоки трех типов: процессоры (ЦП), операционная система (ОП) и подсистема ввода/вывода (I/O). Для подсоединения к модулям I/O используются уже более медленные шины (PCI, VME64). Наиболее известными SMP-системами являются SMP-cервера и рабочие станции на базе процессоров Intel (IBM, HP, Compaq, Dell, ALR, Unisys, DG, Fujitsu и др.) Вся система работает под управлением единой ОС (обычно UNIX-подобной, но для Intel-платформ поддерживается Windows NT). ОС автоматически (в процессе работы) распределяет процессы по процессорам, но иногда возможна и явная привязка.

Основные преимущества SMP-систем:

• простота и универсальность для программирования. Архитектура SMP не накладывает ограничений на модель программирования, используемую при создании приложения: обычно используется модель параллельных ветвей, когда все процессоры работают абсолютно независимо друг от друга - однако, можно реализовать и модели, использующие межпроцессорный обмен. Использование общей памяти увеличивает скорость такого обмена, пользователь также имеет доступ сразу ко всему объему памяти. Для SMP-систем существуют сравнительно эффективные средства автоматического распараллеливания.

• легкость в эксплуатации. Как правило, SMP-системы используют систему охлаждения, основанную на воздушном кондиционировании, что облегчает их техническое обслуживание.

• относительно невысокая цена.

Недостатки:

• системы с общей памятью, построенные на системной шине, плохо масштабируемы
Этот важный недостаток SMP-системы не позволяет считать их по-настоящему перспективными. Причины плохой масштабируемости состоят в том, что в данный момент шина способна обрабатывать только одну транзакцию, вследствие чего возникают проблемы разрешения конфликтов при одновременном обращении нескольких процессоров к одним и тем же областям общей физической памяти. Вычислительные элементы начинают друг другу мешать. Когда произойдет такой конфликт, зависит от скорости связи и от количества вычислительных элементов. В настоящее время конфликты могут происходить при наличии 8-24-х процессоров. Кроме того, системная шина имеет ограниченную (хоть и высокую) пропускную способность (ПС) и ограниченное число слотов. Все это с очевидностью препятствует увеличению производительности при увеличении числа процессоров и числа подключаемых пользователей. В реальных системах можно использовать не более 32 процессоров. Для построения масштабируемых систем на базе SMP используются кластерные или NUMA-архитектуры. При работе с SMP системами используют так называемую парадигму программирования с разделяемой памятью (shared memory paradigm).

 Многядерные процессоры AMD
Архитектура AMD K8 не просто отличается от "интеловской": она концептуально иная, поскольку в ней нет какого-то выделенного центра. Каждый из процессоров архитектуры AMD64 является независимой и "самодостаточной" единицей. С чисто технической стороны AMD попросту интегрировала практически всю функциональность северного моста в центральный прНо "небольшая" технологическая уловка приводит к совсем иной архитектуре компьютера - SUMA, в отличие от традиционной SMP. SUMA - это название AMD, обозначающее, что архитектура вроде относится к NUMA, но не столь "тормознутая".оцессор.
Основа SUMA - последовательная шина HyperTransport. В каждый процессор интегрируется контроллер "локальной" оперативной памяти (собственно, по сравнению с одноядерными процессорами AMD64 контроллер памяти почти не изменился).




Гибридная архитектура (SUMA)

 SUMA - это название AMD, обозначающее, что архитектура относится к NUMA, (nonuniform memory access). Главная особенность такой архитектуры - неоднородный доступ к памяти.

Гибридная архитектура воплощает в себе удобства систем с общей памятью и относительную дешевизну систем с раздельной памятью. Суть этой архитектуры - в особой организации памяти, а именно: память является физически распределенной по различным частям системы, но логически разделяемой, так что пользователь видит единое адресное пространство. Система состоит из однородных базовых модулей (плат), состоящих из небольшого числа процессоров и блока памяти. Модули объединены с помощью высокоскоростного коммутатора. Поддерживается единое адресное пространство, аппаратно поддерживается доступ к удаленной памяти, т.е. к памяти других модулей. При этом доступ к локальной памяти осуществляется в несколько раз быстрее, чем к удаленной. По существу архитектура NUMA является MPP (массивно-параллельная архитектура) архитектурой, где в качестве отдельных вычислительных элементов берутся SMP (cимметричная многопроцессорная архитектура) узлы.

Впервые идею гибридной архитектуры предложил Стив Воллох и воплотил в системах серии Exemplar. Вариант Воллоха - система, состоящая из 8-ми SMP узлов. Фирма HP купила идею и реализовала на суперкомпьютерах серии SPP. Идею подхватил Сеймур Крей (Seymour R.Cray) и добавил новый элемент - когерентный кэш, создав так называемую архитектуру cc-NUMA (Cache Coherent Non-Uniform Memory Access), которая расшифровывается как "неоднородный доступ к памяти с обеспечением когерентности кэшей". Он ее реализовал на системах типа Origin.

Результаты исследований и анализа позволяют заключить, что SUMA — однозначно более совершенная архитектура памяти по сравнению с традиционными SMP-решениями, способная в большинстве случаев обеспечить над ними преимущество по низкоуровневым характеристикам подсистемы памяти.

Математический сопроцессор

Математический сопроцессор — сопроцессор для расширения командного множества центрального процессора и обеспечивающий его функциональностью модуля операций с плавающей запятой, для процессоров, не имеющих интегрированного модуля.

Сопроцессор является независимым процессором, и как таковой может работать с любой тактовой частотой не превышающей допустимую. Решение о скорости работы сопроцессора принимается разработчиком платы. Как узнать, насколько быстрый сопроцессор вам нужен? Следует сопоставить быстродействие процессора с быстродействием сопроцессора.

Модуль операций с плавающей запятой (или с плавающей точкой)— часть процессора для выполнения широкого спектра математических операций над вещественными числами.

Простым «целочисленным» процессорам для работы с вещественными числами и математическими операциями требуются соответствующие процедуры поддержки и время для их выполнения. Модуль операций с плавающей запятой поддерживает работу с ними на уровне примитивов — загрузка, выгрузка вещественного числа (в/из специализированных регистров) или математическая операция над ними выполняется одной командой, за счёт этого достигается значительное ускорение таких операций.

Математический сопроцессор не является обязательным элементом персонального компьютера. От него, в принципе, можно отказаться. Так раньше и поступали из соображений экономии.
Однако, при решении задач, которые требовали выполнения большого количества математических вычислений, например, при научных или инженерных расчетах, остро встал вопрос о повышении производительности компьютера.
Для этого решили использовать дополнительный специальный процессор, который "настроен" на выполнение математических операций и реализует их во много раз быстрее, чем центральный процессор. Таким образом, была получена возможность наращивать производительность центрального процессора за счет специального модуля - математического сопроцессора.
Не в пример центральному процессору, математический сопроцессор не держит под управлением основную массу цепей компьютера. Наоборот, вся деятельность математического сопроцессора определяется центральным процессором, который может посылать математическому сопроцессору команды на выполнение программ и формирование результатов. В обычном режиме центральный процессор выполняет все функции компьютера. И лишь, когда встречается задача, с которой лучше справится математический сопроцессор, ему выдаются данные и команды, а центральный процессор ожидает результаты. К таким задачам относятся, например, математические операции между вещественными числами (операции между числами с плавающей запятой), где числа представлены мантиссой и ординатой (десятичная степень числа, определяющая положение десятичной запятой).
Если раньше, в компьютерах первых поколений (i80386, i80486) модуль математического сопроцессора устанавливался на материнскую плату в виде отдельного чипа, то в современных компьютерах использование математического сопроцессора, как отдельного чипа, не требуется, поскольку он уже встроен в центральный процессор.
Преимущества, которые вы получаете от использования математического сопроцессора, зависят от того, какие задачи решаются на вашем компьютере.
Согласно данным компании INTEL, математический сопроцессор может уменьшить время выполнения математических операций, таких, как умножение, деление и возведение в степень, на 80 процентов и более. Скорость выполнения простых математических операций, таких, как сложение и вычитание, не изменяется.
С практической точки зрения, производительность персонального компьютера, касающаяся подготовки текстов и ведения базы данных (функций, не требующих сложных математических расчетов), не может быть улучшена математическим сопроцессором. Однако, вы получите ощутимый прирост производительности при проведении научных и инженерных расчетов, обработке статистических данных, а также при работе с графикой, так как последняя требует интенсивных математических расчетов.








Hyper-threading

Hyper-threading (англ. Hyper-threading — Гиперпоточность, официальное название Hyper-Threading Technology (HTT)) — торговая марка компании Intel для разработанной ею реализации технологии «одновременной мультипоточности» (англ. Simultaneous multithreading) в процессорах на микроархитектуре NetBurst‎. Расширенная форма суперпоточности (англ. Super-threading), впервые появившаяся в процессорах Intel Xeon и позднее добавленная в процессоры Pentium 4.

Эта технология увеличивает производительность процессора при определённых рабочих нагрузках путём предоставления «полезной работы» (англ. useful work) исполнительным устройствам (англ. execution units), которые иначе будут бездействовать; к примеру, в случаях кэш-промаха. Процессоры Pentium 4 (с одним физическим ядром) с включённым Hyper-threading операционная система определяет как два разных процессора вместо одного.

В процессорах Core 2 Duo поддержка технологии Hyper-threading не была реализована. В процессорах Core i7 снова используется Hyper-threading, при этом каждое физическое ядро процессора определяется операционной системой как два логических. Также эта технология присутствует в мобильных процессорах Core i3, и даже в некоторых процессорах серии Atom.

Принцип работы

В процессорах с использованием этой технологии каждый физический процессор может хранить состояние сразу двух потоков, что для операционной системы выглядит как наличие двух логических процессоров (англ. Logical processor). Физически у каждого из логических процессоров есть свой набор регистров и контроллер прерываний (APIC), а остальные элементы процессора являются общими. Когда при исполнении потока одним из логических процессоров возникает пауза (в результате кэш-промаха, ошибки предсказания ветвлений, ожидания результата предыдущей инструкции), то управление передаётся потоку в другом логическом процессоре. Таким образом, пока один процесс ждёт, например, данные из памяти, вычислительные ресурсы физического процессора используются для обработки другого процесса.

Производительность

Были представлены следующие преимущества Hyper-threading: улучшенная поддержка многопоточного кода, позволяющая запускать потоки одновременно; улучшенная реакция и время отклика; увеличенное количество пользователей, которое может поддерживать сервер.

По словам Intel, первая реализация потребовала всего 5-процентного увеличения площади кристалла, но позволяла увеличить производительность на 15—30 %.

Intel утверждает, что прибавка к скорости составляет 30 % по сравнению с идентичным процессорами Pentium 4 без технологии «Simultaneous multithreading». Однако прибавка к производительности изменяется от приложения к приложению: некоторые программы вообще несколько замедляются при включённой технологии Hyper-threading. Это, в первую очередь, связано с «системой повторения» (англ. replay) процессоров Pentium 4, занимающей необходимые вычислительные ресурсы, отчего и начинают «голодать» другие потоки.


 

 Список использованной литературы

1. Википедия : [Электронный ресурс]. – режим доступа: http://ru.wikipedia.org/wiki/Hyper-threading

2. Сore-2: [Электронный ресурс]. – режим доступа: http://www.core-2.ru/FAQ/Chto-takoe-Hyper-Threading

3. novikov : [Электронный ресурс]. – режим доступа: http://novikov.ua/bnews/2007/07/20/5945/

4. 3dnews : [Электронный ресурс]. – режим доступа: http://www.3dnews.ru/cpu/hyper-treading

5. ezpc : [Электронный ресурс]. – режим доступа: http://ezpc.ru/cpu2.shtml

6. openclass : [Электронный ресурс]. – режим доступа: http://www.openclass.ru/wiki-pages/27309

7. 64zs : [Электронный ресурс]. – режим доступа: http://64zs.com/blogs/computers/2514/

8. osp : [Электронный ресурс]. – режим доступа: http://www.osp.ru/os/2005/10/380433/

9. intuit : [Электронный ресурс]. – режим доступа: http://www.intuit.ru/department/hardware/mcoreproc/

 










Последнее изменение этой страницы: 2018-04-12; просмотров: 258.

stydopedya.ru не претендует на авторское право материалов, которые вылажены, но предоставляет бесплатный доступ к ним. В случае нарушения авторского права или персональных данных напишите сюда...