ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.
Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных
На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.
На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.
Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:
(1)
Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.
(2)
Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.
В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.
Представленные ниже оценки лишены указанных выше недостатков:
(3)
Комбинированная оценка, которая с помощью параметра позволяет изменять вклад оценок P и в конечный результат. При , оценка не учитывает. При , оценка P не учитывает. При оценки P и учитываются равноценно и можно получить следующую комбинированную оценку [5]:
(4)
В работе [0] была представлена, а в работе [0] использована следующая оценка:
(5)
С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:
Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.
Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.
Для численного анализа результатов предлагается использовать количественные оценки качества и .
СПИСОК ЛИТЕРАТУРЫ:
- Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
- Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
- Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
- Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.
Статья в формате PDF
127 KB...
24 03 2026 4:22:39
Статья в формате PDF
110 KB...
23 03 2026 3:48:45
Статья в формате PDF
104 KB...
22 03 2026 10:55:59
Статья в формате PDF
130 KB...
21 03 2026 2:55:49
Статья в формате PDF
127 KB...
20 03 2026 22:12:50
Статья в формате PDF
120 KB...
19 03 2026 19:58:17
Для уникального Кумирского скандий-уран-редкоземельного месторождения впервые описаны субвулканические образования, сформировавшиеся в антидромной последовательности от гранитов до долеритов. Более ранние гранит-порфиры и аляскит-порфиры слагают Кумирский шток, в контакте с которым образовались сложнее по составу метасоматиты от фельдшпатоидов до пропилитов. Гранитоиды формировались в процессе частичного плавления мантийного субстрата(кварцевые эклогиты) и относятся к А-типу (анорогенных гранитоидов), а дайки долеритов обнаруживают в своём образовании мантийно-коровое взаимодействие: смешение мантийной базальтовой магмы и корового материала.
...
17 03 2026 17:19:29
Выявлены количественные и качественные особенности формирования запасов углерода в степных экосистемах.
...
16 03 2026 8:43:40
15 03 2026 1:31:25
Статья в формате PDF
281 KB...
14 03 2026 13:31:15
Статья в формате PDF
131 KB...
13 03 2026 17:50:20
Статья в формате PDF
307 KB...
10 03 2026 23:55:48
Статья в формате PDF
262 KB...
09 03 2026 6:21:28
Статья в формате PDF
122 KB...
08 03 2026 15:25:15
Описан состав Сумсунурского батолита рифейского возраста, сложенного кварцевыми диоритами, тоналитами, трондьемитами, а также дайками лейкогранитов и аплитов, отнесённых по сумме признаков к адакитовым гранитоидам. Среди тоналитов и трондьемитов по минеральному и химическому составам выделяются по две разновидности. В трондьемитах и аплитах проявлены два типа тетрадного эффекта фpaкционирования РЗЭ. Установлено, что в процессе генерации адакитовых гранитоидов участвовали разнородные источники плавления субстрата: мантийный и коровый. Становление породных типов происходило при участии флюидов мантийной природы и корового обводнения. Выдвинуто предположение, что формирование комплексного и крупного по запасам золотого Зун-Холбинского месторождения описываемого района принимали различные источники (мантийные и коровые). Взаимодействие последних генерировало золотое оруденение. Высказано предположение о прострaнcтвенной и парагенетической связи оруденения с раннепалеозойским холбинским и более древним рифейским сумсунурским комплексами.
...
07 03 2026 11:40:30
Статья в формате PDF
245 KB...
06 03 2026 9:12:53
Статья в формате PDF
119 KB...
05 03 2026 13:31:17
В работе рассмотрен вопрос исследования биологической жидкости в формате 3D.
...
04 03 2026 4:10:29
Статья в формате PDF
107 KB...
02 03 2026 16:31:41
Статья в формате PDF
138 KB...
01 03 2026 16:17:35
Статья в формате PDF
249 KB...
28 02 2026 8:52:51
С экологических позиций излагается представление о человеке как метасистеме, состоящей из макроскопического (тело) и микроскопического (микробиота) компонентов. Последний определяется как биоценоз микроорганизмов — бактерий, простейших, микроскопических грибов и вирусов, встречающийся у здоровых людей. Приводятся некоторые количественные хаpaктеристики микробиоты человека: общее число микроорганизмов, суммарная биомасса, процентное содержание облигатной, факультативной и транзиторной составляющих, время, за которое происходит смена генерации микроорганизмов. Рассматриваются главные системоообразующие факторы, обеспечивающие целостность микробиоты: структурный, метаболический, генетический и информационный. Анализируются взаимоотношения микробиоты и макроорганизма в нормальных физиологических условиях и при патологии. Обсуждаются механизмы развития дисбиозов и патогенетически обоснованные подходы к их коррекции.
...
27 02 2026 6:17:49
Статья в формате PDF
250 KB...
26 02 2026 11:55:28
25 02 2026 23:20:33
Статья в формате PDF
120 KB...
22 02 2026 22:14:14
Статья в формате PDF
101 KB...
21 02 2026 18:45:53
Статья в формате PDF
116 KB...
20 02 2026 7:22:48
Статья в формате PDF
272 KB...
19 02 2026 13:15:44
Статья в формате PDF
111 KB...
17 02 2026 3:38:25
Статья в формате PDF
104 KB...
15 02 2026 9:58:40
Статья в формате PDF
300 KB...
14 02 2026 11:55:42
Проведены медико-генетические исследования среди населения трех крупных районов Западной зоны Азербайджана с целью дальнейшего составления регистра фенотипически наиболее легко диагностируемых врожденных пороков развития и наследственных заболеваний, подлежащих обязательной регистрации. Установлена высокая частота распространения нарушений ЦНС, врожденных патологий зрения и слуха. Вычислены фенотипические частоты выявленных патологий. У детей с диагнозом гемолитическая болезнь выявлен полный и частичный дефицит фермента глюкозо-6-фосфатдегидрогеназы. С использованием молекулярного метода полимеразно-цепной реакции идентифицированы типы мутаций β-талассемии в обследованных районах.
...
13 02 2026 23:35:15
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::