МОДИФИКАЦИЯ ДЕРЕВЬЕВ РАЗБОРА ДЛЯ ПАРАЛЛЕЛЬНОГО ИСПОЛНЕНИЯ ЗАПРОСА В СУБД

Основным средством для работы с таблицами, содержащими миллионы строк, является использование какой-либо формы разделения данных и применение алгоритмов для параллельной обработки данных с целью обеспечения приемлемой скорости ответа на пользовательский запрос.
Рассмотрим систему, обеспечивающую работу распределенной СУБД и состоящей из N серверов. Предположим, что пользователь может отправить запрос на языке SQL к любому из N серверов и получить один и тот же ответ от всех серверов (на момент начала исполнения запроса). Такую работу системы можно организовать, к примеру, с использованием одного из методов репликации данных (всей базы, или только части таблиц). В этих условиях возможно создание системы обеспечивающей параллельную обработку SQL запросов, принцип работы которой описан в [1].
Из [2] известно, что схема начальной стадии компиляции запроса состоит из четырех этапов: запрос (текстовое представление) - синтаксический анализатор - препроцессор - генератор логического плана запроса - переписчик логического плана запроса. Дополним эту схему двумя этапами - синтаксический анализатор параллельного запроса и препроцессор параллельного запроса, которые будут предшествовать четырем классическим этапам компиляции. Препроцессор параллельного запроса, в отличие от классической схемы (где он предназначен для замены обозначений деревьями разбора и семантического контроля), в предлагаемой новой схеме модифицирует дерево запроса с целью выделения поддеревьев запроса пригодных для параллельного исполнения. В результате его работы формируется набор новых запросов, обработка которых, в дальнейшем, строится по классической схеме. Преобразования деревьев разбора запроса проводятся препроцессором с использованием заранее известного набора правил, с целью получения эквивалентного запроса. В некоторых случаях после проведения преобразований могут потребоваться дополнительные операции над наборами отношений, возвращаемых запросами.
Под эквивалентностью двух запросов здесь и далее мы будем понимать такие запросы, в результате исполнения которых формируются одинаковые во всех атрибутах кортежей отношения с точностью до порядка следования кортежей, если не задана инструкция сортировки, и с учетом порядка следования в противном случае.
Очевидно, что некоррелированные запросы допускают параллельное исполнение, поэтому все получившиеся подзапросы в дереве разбора запроса могут быть вычислены независимо. Следует заметить, что в общем случае дальнейшее вычисление запроса согласно дереву разбора можно проводить только при получении результатов всех нижестоящих подзапросов и выражений.
Исходя из вышеизложенного замечания, можно сформулировать цели, которые должны достигаться посредством эквивалентных преобразований запросов:
1. Правило преобразования должно из исходного формировать новый запрос, содержащий заранее заданное число некоррелированных подзапросов.
2. Полученные запросы должны обладать приблизительно равной стоимостью исполнения, так как дальнейшее вычисление запроса возможно только после вычисления соответствующих подзапросов, и в случае существенного превышения времени исполнения одного подзапроса над остальными, друге узлы системы (не занятые вычислением подзапроса) могут простаивать. Таким образом, преобразования запроса должно контролировать баланс нагрузки между узлами системы путем соответствующего формирования подзапросов.
3. На верхних уровнях дерева разбора запроса преобразование должно оставлять наиболее «дешевые» операции. Под термином «дешевые» здесь подразумеваются операции, для реализации которых не требуется обработки большого количества записей, так как, к примеру, при их вычислении уже будет невозможно воспользоваться информацией содержащейся в индексах.
4. Преобразование, по возможности, не должно увеличивать объем отношений, получающихся при вычислении подзапросов, для того, чтобы исключить передачу больших объемов данных между узлами системы. Большие объемы таких передач могут серьезно замедлить исполнение запроса и уменьшить выигрыш от параллельного исполнения запроса.
СПИСОК ЛИТЕРАТУРЫ
- М. В. Локшин, О.Я. Кравец. Построение систем для параллельной обработки запросов к СУБД. // Телематика´2004: Труды XI Всероссийской научно-методической конференции (7-10 июня 2004). -СПб:ИТМО. 2004. С. 94-95.
- Гарсиа-Молина Г., Ульман Д., Уидом Д. Системы баз данных. Полный курс. -М. «Вильямс», 2003. - 1088 С.
Статья в формате PDF
222 KB...
29 03 2026 20:13:52
Статья в формате PDF
257 KB...
28 03 2026 13:47:18
Статья в формате PDF
147 KB...
27 03 2026 0:26:58
Статья в формате PDF
141 KB...
26 03 2026 11:25:37
Статья в формате PDF
122 KB...
24 03 2026 7:57:39
Статья в формате PDF
216 KB...
23 03 2026 18:50:23
22 03 2026 19:31:37
21 03 2026 8:19:59
20 03 2026 19:18:28
Статья в формате PDF
107 KB...
19 03 2026 1:14:56
Статья в формате PDF
132 KB...
18 03 2026 19:57:57
Статья в формате PDF
218 KB...
17 03 2026 17:32:22
Статья в формате PDF
122 KB...
16 03 2026 1:34:48
Статья в формате PDF
286 KB...
15 03 2026 13:23:26
Статья в формате PDF
244 KB...
14 03 2026 17:54:55
Предложен новый подход к изучению земного магнетизма. В центре Земли монополь µ, шаровая молния возникает в пучностях стоячих волн монополя. Гравитация – квадрупольное излучение µ.
...
12 03 2026 16:11:27
Статья в формате PDF
100 KB...
11 03 2026 13:42:18
Статья в формате PDF
113 KB...
10 03 2026 17:55:46
Статья в формате PDF
207 KB...
09 03 2026 2:17:40
Развитие интеллекта учащихся происходит эффективно, если усвоение знаний, приобретение умений и навыков из цели образования превращается в средство развития способностей. Для этого надо переосмыслить содержание образования, сконструировать и внедрить эффективные педагогические технологии, позволяющие эффективно решить поставленные задачи. "Химия для математиков" – технология интеграции естественно-математических знаний на разных уровнях. Методика проведения интегрированных уроков "химия – информатика" разработана и успешно применяется в физико-техническом лицее № 1 г. Саратова.
...
08 03 2026 9:51:58
Статья в формате PDF
126 KB...
07 03 2026 17:22:20
Статья в формате PDF
106 KB...
06 03 2026 21:59:10
Статья в формате PDF
101 KB...
05 03 2026 17:59:13
Статья в формате PDF
100 KB...
04 03 2026 17:30:41
Статья в формате PDF
105 KB...
03 03 2026 17:25:36
Статья в формате PDF
169 KB...
02 03 2026 2:48:22
01 03 2026 8:28:49
28 02 2026 4:12:45
Статья в формате PDF
115 KB...
25 02 2026 15:33:21
Статья в формате PDF
113 KB...
24 02 2026 2:36:11
Статья в формате PDF
136 KB...
23 02 2026 15:43:31
Статья в формате PDF
141 KB...
21 02 2026 10:15:37
Статья в формате PDF
125 KB...
20 02 2026 23:59:52
Статья в формате PDF
249 KB...
18 02 2026 12:48:46
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::