МОДИФИКАЦИЯ ДЕРЕВЬЕВ РАЗБОРА ДЛЯ ПАРАЛЛЕЛЬНОГО ИСПОЛНЕНИЯ ЗАПРОСА В СУБД
Основным средством для работы с таблицами, содержащими миллионы строк, является использование какой-либо формы разделения данных и применение алгоритмов для параллельной обработки данных с целью обеспечения приемлемой скорости ответа на пользовательский запрос.
Рассмотрим систему, обеспечивающую работу распределенной СУБД и состоящей из N серверов. Предположим, что пользователь может отправить запрос на языке SQL к любому из N серверов и получить один и тот же ответ от всех серверов (на момент начала исполнения запроса). Такую работу системы можно организовать, к примеру, с использованием одного из методов репликации данных (всей базы, или только части таблиц). В этих условиях возможно создание системы обеспечивающей параллельную обработку SQL запросов, принцип работы которой описан в [1].
Из [2] известно, что схема начальной стадии компиляции запроса состоит из четырех этапов: запрос (текстовое представление) - синтаксический анализатор - препроцессор - генератор логического плана запроса - переписчик логического плана запроса. Дополним эту схему двумя этапами - синтаксический анализатор параллельного запроса и препроцессор параллельного запроса, которые будут предшествовать четырем классическим этапам компиляции. Препроцессор параллельного запроса, в отличие от классической схемы (где он предназначен для замены обозначений деревьями разбора и семантического контроля), в предлагаемой новой схеме модифицирует дерево запроса с целью выделения поддеревьев запроса пригодных для параллельного исполнения. В результате его работы формируется набор новых запросов, обработка которых, в дальнейшем, строится по классической схеме. Преобразования деревьев разбора запроса проводятся препроцессором с использованием заранее известного набора правил, с целью получения эквивалентного запроса. В некоторых случаях после проведения преобразований могут потребоваться дополнительные операции над наборами отношений, возвращаемых запросами.
Под эквивалентностью двух запросов здесь и далее мы будем понимать такие запросы, в результате исполнения которых формируются одинаковые во всех атрибутах кортежей отношения с точностью до порядка следования кортежей, если не задана инструкция сортировки, и с учетом порядка следования в противном случае.
Очевидно, что некоррелированные запросы допускают параллельное исполнение, поэтому все получившиеся подзапросы в дереве разбора запроса могут быть вычислены независимо. Следует заметить, что в общем случае дальнейшее вычисление запроса согласно дереву разбора можно проводить только при получении результатов всех нижестоящих подзапросов и выражений.
Исходя из вышеизложенного замечания, можно сформулировать цели, которые должны достигаться посредством эквивалентных преобразований запросов:
1. Правило преобразования должно из исходного формировать новый запрос, содержащий заранее заданное число некоррелированных подзапросов.
2. Полученные запросы должны обладать приблизительно равной стоимостью исполнения, так как дальнейшее вычисление запроса возможно только после вычисления соответствующих подзапросов, и в случае существенного превышения времени исполнения одного подзапроса над остальными, друге узлы системы (не занятые вычислением подзапроса) могут простаивать. Таким образом, преобразования запроса должно контролировать баланс нагрузки между узлами системы путем соответствующего формирования подзапросов.
3. На верхних уровнях дерева разбора запроса преобразование должно оставлять наиболее «дешевые» операции. Под термином «дешевые» здесь подразумеваются операции, для реализации которых не требуется обработки большого количества записей, так как, к примеру, при их вычислении уже будет невозможно воспользоваться информацией содержащейся в индексах.
4. Преобразование, по возможности, не должно увеличивать объем отношений, получающихся при вычислении подзапросов, для того, чтобы исключить передачу больших объемов данных между узлами системы. Большие объемы таких передач могут серьезно замедлить исполнение запроса и уменьшить выигрыш от параллельного исполнения запроса.
СПИСОК ЛИТЕРАТУРЫ
- М. В. Локшин, О.Я. Кравец. Построение систем для параллельной обработки запросов к СУБД. // Телематика´2004: Труды XI Всероссийской научно-методической конференции (7-10 июня 2004). -СПб:ИТМО. 2004. С. 94-95.
- Гарсиа-Молина Г., Ульман Д., Уидом Д. Системы баз данных. Полный курс. -М. «Вильямс», 2003. - 1088 С.
Статья в формате PDF 119 KB...
27 03 2024 14:46:41
Статья в формате PDF 253 KB...
25 03 2024 10:13:47
Статья в формате PDF 120 KB...
24 03 2024 3:42:22
Статья в формате PDF 120 KB...
23 03 2024 9:34:19
Статья в формате PDF 123 KB...
22 03 2024 8:55:26
Статья в формате PDF 301 KB...
21 03 2024 22:24:53
Статья в формате PDF 249 KB...
19 03 2024 11:54:51
Статья в формате PDF 109 KB...
18 03 2024 8:41:43
Статья в формате PDF 115 KB...
17 03 2024 4:10:30
Статья в формате PDF 101 KB...
16 03 2024 12:40:55
Статья в формате PDF 152 KB...
14 03 2024 7:54:18
Статья в формате PDF 379 KB...
13 03 2024 1:25:55
Статья в формате PDF 126 KB...
12 03 2024 15:43:41
11 03 2024 14:38:22
Статья в формате PDF 144 KB...
10 03 2024 20:14:46
Статья в формате PDF 127 KB...
09 03 2024 21:51:47
Статья в формате PDF 109 KB...
06 03 2024 21:57:13
Статья в формате PDF 138 KB...
05 03 2024 17:24:59
В работе приведены результаты применения ГИС технологий в различном масштабе для анализа структуры растительности и влияние антропогенной нагрузки на параметры растительного покрова регионов, в целом, и отдельных сообществ Якутии, в частности. Примененные подходы могут быть использованы в различном масштабе для анализа степени антропогенного пресса территорий и анализа растительности. ...
04 03 2024 19:42:15
Статья в формате PDF 126 KB...
03 03 2024 23:35:45
Рассмотрены особенности проведения интервального тренинга в сравнении с равномерными тренировками. Определены границы применения интервального метода проведения тренировок. Разработан алгоритм проведения занятий с применением интервального метода тренировок. Приведены результаты курса тренировок и использованием интервального тренинга. ...
02 03 2024 21:12:45
Статья в формате PDF 108 KB...
01 03 2024 14:19:51
Статья в формате PDF 105 KB...
29 02 2024 22:36:27
Статья в формате PDF 104 KB...
28 02 2024 13:13:36
Статья в формате PDF 121 KB...
27 02 2024 13:55:14
26 02 2024 20:11:10
Статья в формате PDF 104 KB...
25 02 2024 21:49:32
Статья в формате PDF 253 KB...
24 02 2024 14:35:47
Статья в формате PDF 109 KB...
21 02 2024 14:47:44
Статья в формате PDF 250 KB...
19 02 2024 1:29:10
Статья в формате PDF 586 KB...
18 02 2024 14:23:32
Статья в формате PDF 274 KB...
17 02 2024 8:41:54
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::