МОДИФИКАЦИЯ ДЕРЕВЬЕВ РАЗБОРА ДЛЯ ПАРАЛЛЕЛЬНОГО ИСПОЛНЕНИЯ ЗАПРОСА В СУБД > Полезные советы
Тысяча полезных мелочей    

МОДИФИКАЦИЯ ДЕРЕВЬЕВ РАЗБОРА ДЛЯ ПАРАЛЛЕЛЬНОГО ИСПОЛНЕНИЯ ЗАПРОСА В СУБД

МОДИФИКАЦИЯ ДЕРЕВЬЕВ РАЗБОРА ДЛЯ ПАРАЛЛЕЛЬНОГО ИСПОЛНЕНИЯ ЗАПРОСА В СУБД

Локшин М.В. Статья в формате PDF 115 KB

Основным средством для работы с таблицами, содержащими миллионы строк, является использование какой-либо формы разделения данных и применение алгоритмов для параллельной обработки данных с целью обеспечения приемлемой скорости ответа на пользовательский запрос.

Рассмотрим систему, обеспечивающую работу распределенной СУБД и состоящей из N серверов. Предположим, что пользователь может отправить запрос на языке SQL к любому из N серверов и получить один и тот же ответ от всех серверов (на момент начала исполнения запроса). Такую работу системы можно организовать, к примеру, с использованием одного из методов репликации данных (всей базы, или только части таблиц). В этих условиях возможно создание системы обеспечивающей параллельную обработку SQL запросов, принцип работы которой описан в [1].

Из [2] известно, что схема начальной стадии компиляции запроса состоит из четырех этапов: запрос (текстовое представление) - синтаксический анализатор - препроцессор - генератор логического плана запроса - переписчик логического плана запроса. Дополним эту схему двумя этапами - синтаксический анализатор параллельного запроса и препроцессор параллельного запроса, которые будут предшествовать четырем классическим этапам компиляции. Препроцессор параллельного запроса, в отличие от классической схемы (где он предназначен для замены обозначений деревьями разбора и семантического контроля), в предлагаемой новой схеме модифицирует дерево запроса с целью выделения поддеревьев запроса пригодных для параллельного исполнения. В результате его работы формируется набор новых запросов, обработка которых, в дальнейшем, строится по классической схеме. Преобразования деревьев разбора запроса проводятся препроцессором с использованием заранее известного набора правил, с целью получения эквивалентного запроса. В некоторых случаях после проведения преобразований могут потребоваться дополнительные операции над наборами отношений, возвращаемых запросами.

Под эквивалентностью двух запросов здесь и далее мы будем понимать такие запросы, в результате исполнения которых формируются одинаковые во всех атрибутах кортежей отношения с точностью до порядка следования кортежей, если не задана инструкция сортировки, и с учетом порядка следования в противном случае.

Очевидно, что некоррелированные запросы допускают параллельное исполнение, поэтому все получившиеся подзапросы в дереве разбора запроса могут быть вычислены независимо. Следует заметить, что в общем случае дальнейшее вычисление запроса согласно дереву разбора можно проводить только при получении результатов всех нижестоящих подзапросов и выражений.

Исходя из вышеизложенного замечания, можно сформулировать цели, которые должны достигаться посредством эквивалентных преобразований запросов:

1. Правило преобразования должно из исходного формировать новый запрос, содержащий заранее заданное число некоррелированных подзапросов.

2. Полученные запросы должны обладать приблизительно равной стоимостью исполнения, так как дальнейшее вычисление запроса возможно только после вычисления соответствующих подзапросов, и в случае существенного превышения времени исполнения одного подзапроса над остальными, друге узлы системы (не занятые вычислением подзапроса) могут простаивать. Таким образом, преобразования запроса должно контролировать баланс нагрузки между узлами системы путем соответствующего формирования подзапросов.

3. На верхних уровнях дерева разбора запроса преобразование должно оставлять наиболее «дешевые» операции. Под термином «дешевые» здесь подразумеваются операции, для реализации которых не требуется обработки большого количества записей, так как, к примеру, при их вычислении уже будет невозможно воспользоваться информацией содержащейся в индексах.

4. Преобразование, по возможности, не должно увеличивать объем отношений, получающихся при вычислении подзапросов, для того, чтобы исключить передачу больших объемов данных между узлами системы. Большие объемы таких передач могут серьезно замедлить исполнение запроса и уменьшить выигрыш от параллельного исполнения запроса.

СПИСОК ЛИТЕРАТУРЫ

  1. М. В. Локшин, О.Я. Кравец. Построение систем для параллельной обработки запросов к СУБД. // Телематика´2004: Труды XI Всероссийской научно-методической конференции (7-10 июня 2004). -СПб:ИТМО. 2004. С. 94-95.
  2.  Гарсиа-Молина Г., Ульман Д., Уидом Д. Системы баз данных. Полный курс. -М. «Вильямс», 2003. - 1088 С.


ПРИОРИТЕТНОЕ ЗНАЧЕНИЕ МАЛОЭТАЖНОГО СТРОИТЕЛЬСТВА

ПРИОРИТЕТНОЕ ЗНАЧЕНИЕ МАЛОЭТАЖНОГО СТРОИТЕЛЬСТВА Статья в формате PDF 275 KB...

25 03 2026 22:54:50

ДИАГНОСТИКА И ЛЕЧЕНИЕ МАСТИТОВ У КОРОВ

ДИАГНОСТИКА И ЛЕЧЕНИЕ МАСТИТОВ У КОРОВ Статья в формате PDF 144 KB...

13 03 2026 21:15:17

ЗЕМНОЙ ЭЛЕКТРОМАГНЕТИЗМ, МОНОПОЛЬ, ШАРОВАЯ МОЛНИЯ

ЗЕМНОЙ ЭЛЕКТРОМАГНЕТИЗМ, МОНОПОЛЬ, ШАРОВАЯ МОЛНИЯ Предложен новый подход к изучению земного магнетизма. В центре Земли монополь µ, шаровая молния возникает в пучностях стоячих волн монополя. Гравитация – квадрупольное излучение µ. ...

12 03 2026 16:11:27

ИНТЕГРИРОВАННЫЕ УРОКИ ХИМИЯ – ИНФОРМАТИКА ПО ТЕМЕ "РЕШЕНИЕ РАСЧЕТНЫХ ЗАДАЧ С УЧЕТОМ МАССОВОЙ ДОЛИ ВЫХОДА ПРОДУКТА РЕАКЦИИ"

ИНТЕГРИРОВАННЫЕ УРОКИ ХИМИЯ – ИНФОРМАТИКА ПО ТЕМЕ "РЕШЕНИЕ РАСЧЕТНЫХ ЗАДАЧ С УЧЕТОМ МАССОВОЙ ДОЛИ ВЫХОДА ПРОДУКТА РЕАКЦИИ" Развитие интеллекта учащихся происходит эффективно, если усвоение знаний, приобретение умений и навыков из цели образования превращается в средство развития способностей. Для этого надо переосмыслить содержание образования, сконструировать и внедрить эффективные педагогические технологии, позволяющие эффективно решить поставленные задачи. "Химия для математиков" – технология интеграции естественно-математических знаний на разных уровнях. Методика проведения интегрированных уроков "химия – информатика" разработана и успешно применяется в физико-техническом лицее № 1 г. Саратова. ...

08 03 2026 9:51:58

ПОЛИТОЛОГО-СОЦИОЛОГИЧЕСКИЙ АНАЛИЗ МЕТАФОРЫ

ПОЛИТОЛОГО-СОЦИОЛОГИЧЕСКИЙ АНАЛИЗ МЕТАФОРЫ Статья в формате PDF 111 KB...

27 02 2026 1:37:20

MANAGEMENT OF KNOWLEDGE IN EDUCATIONAL PROCESS

MANAGEMENT OF KNOWLEDGE IN EDUCATIONAL PROCESS Статья в формате PDF 133 KB...

26 02 2026 8:58:21

Качество жизни детей, больных вирусными гепатитами

Качество жизни детей, больных вирусными гепатитами Статья в формате PDF 136 KB...

23 02 2026 15:43:31

Бражников Андрей Викторович

Бражников Андрей Викторович Статья в формате PDF 84 KB...

22 02 2026 19:43:15

ПСИХОФАРМАКОТЕРАПИЯ У ДЕТЕЙ

Статья в формате PDF 240 KB...

19 02 2026 10:32:25

Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::