РАЗРАБОТКА МЕТОДА ОПИСАНИЯ СЕМАНТИКИ АТРИБУТОВ РЕЛЯЦИОННЫХ БАЗ ДАННЫХ

Авторы
Файлы

Комар Ф.В. Статья в формате PDF 118 KB

В задачах интегрирования баз данных часто возникает проблема оценки сходства объектов [1]. В большинстве случаев такого рода оценка сходства может базироваться на некоторых семантических хаpaктеристиках объектов [2]. Так, например, наиболее примитивной семантической хаpaктеристикой атрибутов отношений можно считать тип атрибута. Однако при интегрировании комплексных баз данных, такой хаpaктеристики недостаточно. Возникает проблема разработки более сложных семантических хаpaктеристик атрибутов, на базе которых в дальнейшем можно разpaбатывать меры сходства объектов баз данных. В данной работе будет предложена семантическая хаpaктеристика атрибутов отношений на базе строковых шаблонов.

Шаблон - общеизвестный образец, трафарет. Шаблоны используются для сжатого описания некоторого множества объектов, без необходимости перечисления всех экземпляров этого множества.

Пусть дано множество объектов (экземпляров) некоторого типа. Пусть на этом множестве заданы правила определения шаблонов и язык шаблонов L - это формальный язык определения шаблонов. Каждый шаблон определяет набор экземпляров , которые удовлетворяют данному шаблону. Множество является подмножеством множества всех возможных экземпляров U [3].

Опишем синтаксис и структуру шаблонов, которые будем использовать для описания строковых данных. Разобьем символы в иерархически упорядоченные группы (см. рис. 1).

Рис. 1. Иерархия символов строкового шаблона.

В квадратных скобках будем обозначать группы символов, которые могут присутствовать на текущей позиции строки. Например [а, б, в] - множество букв а, б, в. Конструкция вида [а, б, в]{n, m} - означает, что символы а, б, в встречаются в количество от n до m. Конструкция вида [а, б, в]{n, } - означает, что символы а, б, в встречаются в количество не менее n. Конструкция вида [а, б, в]{ , m} - означает, что символы а, б, в встречаются в количество не более m. Отметим, что в квадратных скобках может так же присутствовать некоторый шаблон, который в данном случае будем называть подшаблоном.

Для удобства использования и в соответствии с рисунком 1 введем следующие обозначения групп символов:

- множество букв нижнего регистра: [а, б, в, ..., я];

- множество букв верхнего регистра: [А, Б, В, ..., Я];

- множество любых символов;

- множество букв [а, б, в, ... , я, А, Б, В, ... , Я];

- множество цифр [0, 1, 2, ... , 9];

- множество букв и цифр;

- знак пунктуации [!, ", #, $, %, &, ´, (, ), *, +, ,, -, ., /, :, ;, <, =, >, ?, @, [, , ], ^, _, `, {, |, }, ~];

- множество разделителей [ , , f, , s];

Как было показано выше, любой шаблон определяет некоторое множество строк. И можно считать, что данный шаблон является некоторым семантическим описанием этого множества строк. Очевидно, что один шаблон не может полностью описать все семантические особенности данного множества строк, однако некоторую семантическую значимость шаблон, безусловно, несет. С одной стороны шаблон тем лучше описывает множество строк, чем больше строк из этого множества удовлетворяют шаблону. С другой стороны шаблон тем лучше описывает множество строк, чем больше строк, не принадлежащих данному множеству, не удовлетворяют этому шаблону. Семантической значимостью можно считать некоторую обобщенную численную оценку, удовлетворяющую указанным выше свойствам. Можно так же предположить, что при определенных условиях некоторое множество шаблонов в совокупности будет иметь семантическую значимость для множества строк.

Для примера рассмотрим множество строк вида: Имя Фамилия. Естественным образом можно сказать, что шаблон вида

имеет некоторую семантическую значимость. Очевидно так же, что указанный выше шаблон не представляет полностью семантику множества строк указанных выше. Более того, для предложенного примера можно составить целое множество шаблонов, которые будут с тем или иным уровнем семантической значимости описывать множество указанных строк. Например:

и т.д.

Очевидно, что для множества строк, можно отыскать такой шаблон, которому будут удовлетворять все строки данного множества, однако при этом семантической значимости у этого шаблона будет не велика. Так например семантическая значимость шаблона вида будет гораздо меньше чем семантическая значимость шаблона вида

Любая реляционная база данных содержит некоторое множество атрибутов, а так же множество конкретных значений каждого атрибута [4]. Пусть - множество всех атрибутов базы данных. Пусть - множество значений атрибута , - набор, множеств значений атрибутов, φ - некоторый шаблон. Рассмотрим функцию:

(6)

где - определенная выше функция, которая возвращает количество строк из множества , которые удовлетворяют шаблону φ, а - объем множества .

Функция дает численную оценку того, насколько точно шаблон описывает строки, которые принадлежат рассматриваемому домену. Значения функции лежат на отрезке [0, 1]. В дальнейшем эту величину будем кратко называть частотой появления шаблона φ на множестве .

Определим функцию:

(7)

где - набор множеств значений атрибутов. Указанная функция дает усредненное значение численной оценки того, насколько точно шаблон описывает строки, принадлежащие соответствующим множествам строк.

Определим функцию:

(8)

где - множество значений i- го атрибута, - набор всех множеств значений атрибутов, кроме i- го. Значение функции тем выше, чем больше экземпляров множества i- го атрибута удовлетворяют шаблону φ и чем меньше среднее значение количества экземпляров остальных атрибутов удовлетворяющих шаблону. Значения функции лежат на отрезке [0, 1]. Максимальное значение функция принимает в том случае, когда все значения i- го атрибута удовлетворяют шаблону φ, и ни один экземпляр остальных атрибутов не удовлетворяет шаблону φ.

Примем значение функции pV как численное выражение семантической значимости атрибута A относительно атрибутов в контексте шаблона φ.

Для множества шаблонов определим функцию семантической значимости, как среднее значение семантической значимости каждого шаблона в отдельности:

(9)

Таким образом, множество шаблонов может считаться некоторой семантической хаpaктеристикой атрибута реляционной базы данных. Для построения такого множества необходимо решить задачу максимизации функции семантической значимости. Разработка метода решения такого рода задачи позволит автоматически строить семантическую хаpaктеристику атрибутов реляционных баз данных.

СПИСОК ЛИТЕРАТУРЫ:

W. Hasselbring. Information system integration. //Communications of the ACM, 43(6)33-38, 2000.
Цаленко М. Ш. Моделирование семантики в базах данных. - М.: Наука, 1989. - 287 c.
Фридл Дж. Регулярные выражения, 2-е издание. - Спб.: Питер, 2003. - 464 с.
Дейт К. Дж. Введение в системы баз данных, 7-е издание. - Пер. с англ. - М.: Издательский дом Вильямс, 2001. - 1072 c.

СУТОЧНАЯ ДИНАМИКА ГИПОТЕРМИЧЕСКОГО ЭФФЕКТА МЕЛАТОНИНА У ЛИЦ ПОЖИЛОГО И СТАРЧЕСКОГО ВОЗРАСТА

Статья в формате PDF 114 KB...

22 07 2026 1:23:27

МАГНИТОЭЛЕКТРИЧЕСКИЙ ЭФФЕКТ И ЕГО ПРИМЕНЕНИЕ В НАУКЕ И ТЕХНИКЕ

Статья в формате PDF 108 KB...

21 07 2026 16:46:27

Использование электроактивированной водной системы в качестве экстрагента при производстве хмелевого экстpaкта

Статья в формате PDF 113 KB...

20 07 2026 1:58:31

Акустические волны в многослойных структурах

Статья в формате PDF 123 KB...

19 07 2026 8:46:15

ФРЕЗЕРОВАНИЕ: ОПАСНОСТИ И ВРЕДНЫЕ ФАКТОРЫ

Статья в формате PDF 253 KB...

18 07 2026 8:54:49

МЕДИЦИНСКАЯ ЭКСПЕРТНАЯ СИСТЕМА В ОБЛАСТИ ЛОР-ЗАБОЛЕВАНИЙ, СВЯЗАННЫХ С НАСМОРКОМ

Статья в формате PDF 125 KB...

17 07 2026 21:45:40

РАЗРАБОТКА КОКТЕЙЛЯ ДЛЯ СПОРТИВНОГО ПИТАНИЯ С ИСПОЛЬЗОВАНИЕМ L-КАРНИТИНА

Статья в формате PDF 416 KB...

16 07 2026 14:59:12

МОРФОЛОГИЧЕСКАЯ ХАРАКТЕРИСТИКА ВИРУСНЫХ ЗАБОЛЕВАНИЙ ПОЛОСТИ РТА

Статья в формате PDF 245 KB...

15 07 2026 22:12:43

УГЛЕРОДНЫЕ АДСОРБЕНТЫ ИЗ ОТХОДОВ ПЕРЕРАБОТКИ ДРЕВЕСИНЫ ДЛЯ ОЧИСТКИ СТОЧНЫХ ВОД

Статья в формате PDF 232 KB...

14 07 2026 9:56:38

ГЕРПЕСВИРУСНАЯ И ХЛАМИДИЙНАЯ ИНФЕКЦИЯ В ЭТИОЛОГИИ И СТРУКТУРЕ ВОСПАЛИТЕЛЬНЫХ ЗАБОЛЕВАНИЙ ГЛАЗ

Статья в формате PDF 92 KB...

13 07 2026 1:17:54

УДОБРЕНИЯ И ПРОДУКТИВНОСТЬ ЭХИНАЦЕИ ПУРПУРНОЙ НА ЮГЕ РОССИИ

Статья в формате PDF 244 KB...

12 07 2026 22:42:18

УПРОЧНЕНИЕ ИНСТРУМЕНТА ТЕРМОМЕХАНИЧЕСКОЙ ОБРАБОТКОЙ ПРИ ШТАМПОВКЕ

Статья в формате PDF 254 KB...

11 07 2026 10:12:55

ЖУРНАЛ «ВЕСТНИК РУССКОГО ХРИСТИАНСКОГО ДВИЖЕНИЯ» (К 80-ЛЕТИЮ ИЗДАНИЯ)

Культуру Русского зарубежья невозможно представить без журналистики, одно из значительных мест в которой занимает журнал «Вестник», основанный во Франции в 1925 году как печатный орган Русского Студенческого Христианского Движения за рубежом и верно следовавший своей основной цели – объединению верующей молодежи для служения православной церкви и защиты ее и веры – все эти годы. На сегодняшний день «Вестник» – не только старейший журнал Русского зарубежья, но и одно из немногих изданий, без которого она была бы много беднее. ...

10 07 2026 22:55:16

ПРИКЛАДНОЕ ЗНАЧЕНИЕ СРАВНИМОСТИ ЧИСЕЛ В КРИПТОГРАФИИ

Статья в формате PDF 851 KB...

09 07 2026 22:51:32

ГРАФИЧЕСКИЙ АНАЛИЗ УСТОЙЧИВОСТИ

Статья в формате PDF 567 KB...

08 07 2026 22:50:44

ПРИНЦИП МОДЕЛИРОВАНИЯ ПРОГРАММЫ АДАПТИВНОЙ ФИЗИЧЕСКОЙ КУЛЬТУРЫ В РЕАБИЛИТАЦИИ БОЛЬНЫХ ИБС, ПЕРЕНЕСШИХ ОСТРЫЙ ИНФАРКТ МИОКАРДА

Статья в формате PDF 122 KB...

07 07 2026 3:27:43

ОПТИЧЕСКИЕ ИССЛЕДОВАНИЯ КРОВИ В ВИДИМОМ СПЕКТРАЛЬНОМ ДИАПАЗОНЕ

Статья в формате PDF 164 KB...

06 07 2026 6:44:49

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДИНАМИКОЙ ПРОИЗВОДСТВЕННЫХ ПОТОКОВ НА ТЕХНОЛОГИЧЕСКИХ ЛИНИЯХ

Статья в формате PDF 96 KB...

05 07 2026 7:46:28

НЕЙРОСЕТЕВОЙ ФУНКЦИОНАЛЬНЫЙ ПРЕОБРАЗОВАТЕЛЬ В СИСТЕМЕ УПРАВЛЕНИЯ ЭЛЕКТРОМЕХАНИЧЕСКИМ ПРОТЕЗОМ РУКИ

Статья в формате PDF 129 KB...

04 07 2026 14:13:20

ГОСУДАРСТВЕННО-ЧАСТНОЕ ПАРТНЕРСТВО В ЛЕСНОМ КОМПЛЕКСЕ

Статья в формате PDF 293 KB...

03 07 2026 2:48:10

ОСОБЕННОСТИ ОБУЧЕНИЯ В МАГИСТРАТУРЕ СОВРЕМЕННЫХ ВУЗОВ

Статья в формате PDF 131 KB...

02 07 2026 2:30:32

НЕКОТОРЫЕ ОСОБЕННОСТИ ДЕМОГРАФИЧЕСКИХ ПРОЦЕССОВ В РЕСПУБЛИКАХ СЕВЕРНОГО КАВКАЗА

Статья в формате PDF 110 KB...

01 07 2026 12:52:20

АЛЬТЕРНАТИВНЫЙ МЕТОД ЛЕЧЕНИЯ БАКТЕРИАЛЬНОГО ВАГИНОЗА У БЕРЕМЕННЫХ ЖЕНЩИН ГЕЛЕМ АСКОРБАТ-ХИТОЗАН-МЕТРОНИДАЗОЛ

Статья в формате PDF 113 KB...

30 06 2026 8:59:41

ЯКУТСКАЯ ПОРОДА ЛОШАДЕЙ В ДРУГИХ РЕГИОНАХ РОССИИ

Статья в формате PDF 276 KB...

29 06 2026 7:57:12

ВОЗДЕЙСТВИЕ ЛЕСНЫХ ПОЖАРОВ В ТУВЕ НА БИОРАЗНООБРАЗИЕ

Статья в формате PDF 286 KB...

28 06 2026 13:35:22

ИССЛЕДОВАНИЕ УСЛОВИЙ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ

Статья в формате PDF 256 KB...

27 06 2026 22:22:24

МОРФО-ФУНКЦИОНАЛЬНЫЕ ПАРАМЕТРЫ КОЛЛАГЕНА В НОРМЕ И ПРИ ПАТОЛОГИИ

В обзоре представлены результаты научных исследований по изучению морфо-функциональной динамики коллагена при течении как физиохогических, так и патологических процессов в организме. Показано активное участие коллагена в течении заболеваний весьма отличных по патогенетическим механизмам формирования. Следует отметить, что в последние годы наблюдается повышенный интерес к изучению биохимических параметров обмена коллагена при различных заболеваниях и, как свидетельствуют результаты исследований, их динамика в большинстве своем является отражением тяжести патологического процесса в различных физиологических системах. ...

26 06 2026 8:21:14

Хирургическое лечение острого холецистита

Статья в формате PDF 125 KB...

25 06 2026 23:29:48

СОСТОЯНИЕ ИММУННЫХ РЕАКЦИЙ В ОРГАНИЗМЕ БЕРЕМЕННЫХ ПРИ ГЕСТОЗЕ

Статья в формате PDF 111 KB...

24 06 2026 17:21:59

КИСЛОТНО-ЩЕЛОЧНОЙ БАЛАНС У ЖИВОТНЫХ НА РАННИХ ЭТАПАХ ОНТОГЕНЕЗА

Статья в формате PDF 111 KB...

23 06 2026 11:28:12

ОСНОВЫ ВЫЯВЛЕНИЯ, ДИАГНОСТИКИ И ЛЕЧЕНИЯ ТУБЕРКУЛЕЗА (учебное пособие)

Статья в формате PDF 107 KB...

22 06 2026 9:13:20

ПОКАЗАНИЯ К УДАЛЕНИЮ ПОСТОЯННЫХ ЗУБОВ ПО ДАННЫМ ИЗМЕРЕНИЯ ФРОНТАЛЬНО-ДИСТАЛЬНОЙ ДИАГОНАЛИ ЗУБНОЙ ДУГИ

Статья в формате PDF 290 KB...

21 06 2026 17:21:22

РАЗВИТИЕ ВЕЛОСИПЕДНОГО ДВИЖЕНИЯ ДЛЯ УЛУЧШЕНИЯ ЭКОЛОГИЧЕСКОЙ ОБСТАНОВКИ В КРУПНЫХ ГОРОДАХ

Статья в формате PDF 301 KB...

20 06 2026 10:44:39

МЕХАНИЗМ ОБРАЗОВАНИЯ ПЫЛЕВЫХ ОБЛАКОВ ПРИ ИЗВЕРЖЕНИИ ВУЛКАНОВ

Статья в формате PDF 117 KB...

19 06 2026 23:58:41

МОДЕЛИРОВАНИЕ ХАРАКТЕРНЫХ ЗОН ПОЖАРОТУШЕНИЯ ДЛЯ ПРОИЗВОЛЬНО НАПРАВЛЕННОГО ФАКЕЛА ПЛАМЕНИ

Статья в формате PDF 118 KB...

18 06 2026 15:12:41

ОСОБЕННОСТИ АНАТОМИЧЕСКОЙ СТРУКТУРЫ РОГОЗА УЗКОЛИСТНОГО В УСЛОВИЯХ НАГРУЗКИ ПО СВИНЦУ

Установлено влияние уксуснокислого свинца (2,5∙10–1 мг/л) на анатомическое строение почвенных и водных корней рогоза узколистного (Typha angustifolia L.). Происходит адаптационное перераспределение активности разрушения паренхимных клеток и образования воздухоносных полостей с водных корней, непосредственно контактирующих с растворенной в воде солью, на почвенные. Объем воздухоносных полостей специфичен периоду вегетации растений и возрасту корней. ...

17 06 2026 1:58:27

Серотонинпродуцирующие клетки желудка при рефлюкс-эзофагите

Статья в формате PDF 119 KB...

16 06 2026 3:26:17

ЛИНГВОЭКОЛОГИЧЕСКИЙ ПОВОРОТ В МЫШЛЕНИИ МАРИЙСКОГО ЭТНОСА

Статья в формате PDF 152 KB...

15 06 2026 3:25:50

ОЦЕНКА ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ ВТОРИЧНЫХ РЫБОПЕРЕРАБАТЫВАЮЩИХ РЕСУРСОВ

Статья в формате PDF 111 KB...

14 06 2026 8:16:41

ПРАВОВАЯ РЕГЛАМЕНТАЦИЯ ЖИЗНИ ВДОВ СЛУЖИТЕЛЕЙ ЦЕРКВИ ВО ВТОРОЙ ПОЛОВИНЕ XIX – НАЧАЛЕ XX ВВ. (НА ПРИМЕРЕ КУРСКОЙ ГУБЕРНИИ)

Зачастую жены священно и церковнослужителей к 40 годам оставались без супруга с 6-8 детьми на руках, половина из которых малолетние, а некоторые носителями неизлечимой болезни. Права на наследство и различного рода материальную помощь строго регламентировались Синодальным управлением. Семьи получали полные пенсии после cмepти родителя, если выслуга составляла не менее 30 лет. Малоимущие семьи священников имели право на получение единовременного пособия. Если срок выслуги отца семейства был менее 10 лет. Благополучие вдов с детьми священно и церковнослужителей зависело от состояния здоровья отца, что давало возможность исправно и в соответствии с временными нормами выработки нести службу, в противном же случае – святое семейство оставалось без средств к существованию. ...

13 06 2026 23:23:59