ИСПОЛЬЗОВАНИЕ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ В МАССОВЫХ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЯХ > Полезные советы
Тысяча полезных мелочей    

ИСПОЛЬЗОВАНИЕ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ В МАССОВЫХ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЯХ

ИСПОЛЬЗОВАНИЕ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ В МАССОВЫХ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛЕНИЯХ

Воронкин Е.В. Бикташев Р.А. Статья в формате PDF 307 KB

Универсальные процессоры (CPU) созданы для исполнения одного потока последовательных инструкций с максимальной производительностью, а графические процессоры (GPU) проектируются для быстрого исполнения большого числа параллельно выполняемых потоков инструкций.

Для увеличения производительности CPU стараются добиться выполнения как можно большего числа инструкций параллельно. Начиная с процессоров Intel Pentium, появилось суперскалярное выполнение, обеспечивающее выполнение двух инструкций за такт. Но у параллельного выполнения последовательного потока инструкций есть определённые базовые ограничения и увеличением количества исполнительных блоков кратного увеличения скорости не добиться.

Алгоритмы, реализуемые видеочипами, обладают естественным параллелизмом. Видеочип принимает на входе группу полигонов, проводит все необходимые операции, и на выходе выдаёт пиксели. Обработка полигонов и пикселей независима, их можно обpaбатывать параллельно, отдельно друг от друга. Высокая степень параллелизма в GPU вызывает необходимость использования большого количества исполнительных блоков, которые легко загрузить, в отличие от последовательного потока инструкций для CPU. Кроме того, современные GPU также могут исполнять больше одной инструкции за такт.

В универсальных процессорах большая часть транзисторов и площади чипа идут на буферы комaнд, аппаратное предсказание ветвления и огромные объёмы внутри чиповой кэш-памяти. Все эти аппаратные блоки нужны для ускорения исполнения немногочисленных потоков комaнд. Видеочипы тратят транзисторы на массивы исполнительных блоков, разделяемую память небольшого объёма и контроллеры памяти на несколько каналов. Вышеперечисленное не ускоряет выполнение отдельных потоков, оно позволяет чипу обpaбатывать нескольких тысяч потоков, одновременно исполняющихся чипом и требующих высокой пропускной способности памяти.

CPU снижают задержки доступа к памяти при помощи кэш-памяти большого размера. Видеочипы обходят проблему задержек доступа к памяти за счет готовности исполнения тысяч потоков. В то время, когда один из потоков ожидает данных из памяти, видеочип может выполнять вычисления другого потока без ожидания и задержек. Можно сказать, что в отличие от современных универсальных CPU, видеочипы предназначены для параллельных вычислений с большим количеством арифметических операций. И значительно большее число транзисторов GPU работает по прямому назначению ‒ обработке массивов данных, а не управляет исполнением немногочисленных последовательных вычислительных потоков. На рисунке показаны соотношения объема чипа занимаемого разнообразной логикой в CPU и GPU.

Основой эффективного использования мощи GPU в научных и иных неграфических расчётах является распараллеливание алгоритмов на сотни исполнительных блоков, имеющихся в видеочипах. К примеру, множество приложений по молекулярному моделированию отлично приспособлено для расчётов на видеочипах, они требуют больших вычислительных мощностей и поэтому удобны для параллельных вычислений. А использование нескольких GPU даёт ещё больше вычислительных мощностей для решения подобных задач.

Выполнение расчётов на GPU показывает отличные результаты в алгоритмах, использующих параллельную обработку данных. При этом лучшие результаты достигаются, если отношение числа арифметических инструкций к числу обращений к памяти достаточно велико.

Области применения параллельных расчётов на GPU. Это анализ и обработка изображений и сигналов, моделирование физических процессов, выполнение финансовых расчётов, ведение баз данных, моделирование динамики газов и жидкостей, криптография, астрономия, биоинформатика, цифровое кино и телевидение, геоинформационные системы, магнитно-резонансная томография, нейросети, искусственный интеллект, анализ спутниковых данных, сейсмическая разведка.



ЛОМОВ ЮРИЙ МИХАЙЛОВИЧ

ЛОМОВ ЮРИЙ МИХАЙЛОВИЧ Статья в формате PDF 115 KB...

11 06 2026 0:18:15

ЭКОЛОГИЧЕСКАЯ ПАУЗА ЧЕЛОВЕЧЕСТВА

ЭКОЛОГИЧЕСКАЯ ПАУЗА ЧЕЛОВЕЧЕСТВА Статья в формате PDF 157 KB...

05 06 2026 22:27:53

ОТКАЗЫ ОТ ДЕТЕЙ: МОГУТ ЛИ БЫТЬ ОПРАВДАННЫМИ ПРИЧИНЫ?

ОТКАЗЫ ОТ ДЕТЕЙ: МОГУТ ЛИ БЫТЬ ОПРАВДАННЫМИ ПРИЧИНЫ? Статья в формате PDF 114 KB...

28 05 2026 18:47:30

ОЛИГОМЕРЫ НА ОСНОВЕ ОТХОДОВ НЕФТЕХИМИИНАПОЛНИТЕЛИ БУТАДИЕН-СТИРОЛЬНЫХ КАУЧУКОВ

ОЛИГОМЕРЫ НА ОСНОВЕ ОТХОДОВ НЕФТЕХИМИИНАПОЛНИТЕЛИ БУТАДИЕН-СТИРОЛЬНЫХ КАУЧУКОВ Рассмотрен вопрос получения модифицированного высокотемпературным воздействием в присутствии гидропероксида пинана олигомерного продукта из отходов производства СК. Исследован процесс получения водноолигомерноантиоксидантной дисперсии на его основе. Проведена оценка влияния добавки данной дисперсии на процесс выделения каучука из латекса. ...

23 05 2026 18:12:33

К КИНЕТИКЕ ПРОЦЕССОВ РОСТА, РАЗМНОЖЕНИЯ И ГИБЕЛИ МИКРООРГАНИЗМОВ

К КИНЕТИКЕ ПРОЦЕССОВ РОСТА, РАЗМНОЖЕНИЯ И ГИБЕЛИ МИКРООРГАНИЗМОВ Рассмотрен вариант синхронного деления клеток. Предложены кинетические уравнения, описывающие рост, размножение и гибель микроорганизмов с учетом как естественной cмepтности, так и внутривидовой борьбы. Рассматривается квазистационарный метод решения уравнения для определения плотности функции распределения микроорганизмов по возрастам. Предложен явный вид коэффициента диффузии в прострaнcтве масс. Получено аналитическое решение в квазистационарном приближении для плотности функции распределения микроорганизмов по возрастам для случая, когда рост клетки пропорционален ее массе (объему). ...

21 05 2026 17:41:17

ФОРМА И ТОПОГРАФИЯ ДВЕНАДЦАТИПЕРСТНОЙ КИШКИ У МОРСКОЙ СВИНКИ

ФОРМА И ТОПОГРАФИЯ ДВЕНАДЦАТИПЕРСТНОЙ КИШКИ У МОРСКОЙ СВИНКИ Двенадцатиперстная кишка у морской свинки имеет полукольцевидную форму и четыре части (луковица, краниальная, нисходящая и каудальная), в отличие от человека и белой крысы, очень сильно вытянута и согнута с образованием двух V-образных петель. ...

15 05 2026 20:39:57

МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЗДРАВООХРАНЕНИИ

МАТЕМАТИЧЕСКИЕ МОДЕЛИ В ЗДРАВООХРАНЕНИИ Статья в формате PDF 103 KB...

12 05 2026 14:20:56

АНАТОМИЯ УРЕТРОВЕЗИКАЛЬНОГО СЕГМЕНТА И ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ У МУЖЧИН, ОТНОСЯЩИХСЯ К РАЗЛИЧНЫМ РАСАМ

АНАТОМИЯ УРЕТРОВЕЗИКАЛЬНОГО СЕГМЕНТА И ПРЕДСТАТЕЛЬНОЙ ЖЕЛЕЗЫ У МУЖЧИН, ОТНОСЯЩИХСЯ К РАЗЛИЧНЫМ РАСАМ Проведено исследование 63 препаратов уретровезикального сегмента и предстательной железы мужчин первого зрелого периода, относящихся к различным расам: европеоидам и монголоидам. Результаты: 1. межмочеточниковая складка Мерсье, расстояние от внутреннего отверстия уретры до устья мочеточника, площадь треугольника Льето достоверно больше у монголоидов при отсутствии достоверной разницы показателей «уретрального» угла треугольника Льето. 2. уретровезикальный угол, длина супрамонтанной части простатического отдела уретры и длина всего простатического отдела уретры у монголоидов достоверно больше. 3. семенной бугорок у представителей монголоидной расы в 85,7% представлял собой утолщение центральной складки простатического отдела уретры, наличие простатической маточки не зарегистрировано ни в одном случае. Семенной бугорок представителей европеоидной расы был более выражен и представлял собой анатомическое образование бόльшими размерами, простатическая маточка зарегистрирована в 60% случаев. 4. общий объем простаты у европеоидов и монголоидов не отличался, однако, центральная ее доля у монголоидов достоверно больше, а переходная достоверно меньше. ...

09 05 2026 14:59:35

ОПРОВЕРЖЕНИЕ КЛАССИЧЕСКОЙ ФИЗИКИ НЬЮТОНА

ОПРОВЕРЖЕНИЕ КЛАССИЧЕСКОЙ ФИЗИКИ НЬЮТОНА 1. Второй закон Ньютона в катастрофе – это неоспоримый факт. 2. Нужно думать, что после такой катастрофы вся классическая физика полетит к черту, вместе с физиками, которые попытаются ее защищать. 3. Ученые физики всех стран попали в капкан, у них дилемма: или они признают теорию Ростовцева, или им грозит скамья подсудимых за ложную науку и обман человечества. 4. Всю классическую физику нужно пересмотреть и поставить на теоретическую основу. ...

05 05 2026 7:28:29

ЭКДИСТЕРОИДЫ ВОЛДЫРНИКА ЯГОДНОГО (CUCUBALUS BACCIFER L.)

ЭКДИСТЕРОИДЫ ВОЛДЫРНИКА ЯГОДНОГО (CUCUBALUS BACCIFER L.) Статья в формате PDF 141 KB...

04 05 2026 7:39:29

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::