ОЦЕНКА АДЕКВАТНОСТИ МЕТОДОВ ИНТЕГРИРОВАНИЯ СХЕМ ДАННЫХ

В настоящее время ведется активная работа по разработке методов интегрирования схем данных [1, 2]. Предлагаются новые подходы и методы автоматизированного интегрирования [3]. Как следствие встает проблема оценки адекватности методов интегрирования схем данных [4]. Важную роль в оценке результатов применения методов интегрирования схем данных играет эталонное отображение элементов, построенное экспертами.
Рис. 1. Сравнение эталонного и автоматически построенного отображения элементов схем данных
На базе такого эталонного отображения можно различными методами вычислять количественные оценки качества отображения построенного автоматизированным методом.
На рисунке 1 представлены возможные варианты отождествлений. Множество А - это множество истинных, определенных экспертом, соответствий между элементами схем данных. По своей сути множество A - это ошибочно не распознанные соответствия. Множество B - это множество истинных соответствий, которые были включены в автоматически построенное отображение элементов схем данных. По своей сути множество B - это та часть соответствий, которая была верно распознана методом. Множество C - это множество соответствий, которые были включены в автоматически построенное отображение, но на самом деле не являющихся истинными. По своей сути множество C - это множество ошибочно распознанных соответствий. Множество D - это множество ложных соответствий. По своей сути множество D является множеством верно отброшенных методом соответствий. Очевидно, что чем точнее совпадают множества соответствий эталонного отображения и автоматически построенного отображения, тем выше адекватность автоматически построенного отображения.
Наиболее простыми оценками адекватности построенного отображения могут служить следующие численные хаpaктеристики [0]:
(1)
Данная оценка отображает долю найденных истинных соответствий по отношению к общему числу соответствий вошедших в автоматически построенное отображение.
(2)
Данная оценка отображает долю автоматически найденных истинных соответствий по отношению к общему числу истинных соответствий.
В случае, когда автоматически построенное отображение дает идеальный результат, имеем . Однако рассмотренные отдельно друг от друга ни оценка P, ни оценка не дают возможности сделать выводы о качестве рассматриваемого отображения. Действительно, оценка P может быть увеличена путем включения в отображения малого числа соответствий с предельно высоким уровнем достоверности. При этом оценка будет заведомо занижена. Включая в отображение как можно большее количество соответствий, будет увеличена оценка . При этом оценка P будет заведомо снижена.
Представленные ниже оценки лишены указанных выше недостатков:
(3)
Комбинированная оценка, которая с помощью параметра позволяет изменять вклад оценок P и в конечный результат. При , оценка не учитывает. При , оценка P не учитывает. При оценки P и учитываются равноценно и можно получить следующую комбинированную оценку [5]:
(4)
В работе [0] была представлена, а в работе [0] использована следующая оценка:
(5)
С учетом вышесказанного предлагается следующий метод оценки адекватности метода интегрирования схем данных:
Сравнительный анализ методов должен проводиться на заранее подготовленных тестовых задачах. Тестовые задачи должны быть стандартизированы и общепризнанны.
Эталонное отображение в каждой тестовой задаче должно быть построено с учетом мнения нескольких экспертов. Возможно усреднение отображений построенных каждым экспертом для получения единого эталонного отображения. Или же возможно сравнение результатов автоматизированного отождествления с эталонным отображением каждого эксперта и усреднение полученных величин качества.
Для численного анализа результатов предлагается использовать количественные оценки качества и .
СПИСОК ЛИТЕРАТУРЫ:
- Брюхов Д.О. Интероперабельные информационные системы: архитектуры и технологии. / Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. // СУБД, № 4, 1995
- Калиниченко Л. А. Методы и средства интеграции неоднородных баз данных. - М.: Наука, 1983. - 423 c.
- Do Hong-Hai, Rahm Erhard. COMA - A System for Flexible Combination of Schema Matching Approach. // VLDB, 2002.
- Do Hong-Hai, Melnik Sergey, Rahm, Erhard. Comparison of Schema Matching Evaluations // Proc. GI-Workshop "Web and Databases", Erfurt, Oct. 2002.
- Melnik Sergey, Garcia-Molina Hector, Rahm Erhard. Similarity Flooding: A Versatile Graph Matching Algorithm (Extended Technical Report) 2001.
Статья в формате PDF
132 KB...
13 04 2026 8:39:34
Статья в формате PDF
105 KB...
12 04 2026 19:35:27
11 04 2026 13:14:21
Получены закономерности взаимного влияния концентрации по 22 видам загрязнения семи родников, отобранных для исследования моделированием взаимосвязей между факторами. Дана полная корреляционная матрица монарных (на основе рангового или рейтингового распределения) и бинарных (между парами взаимно влияющих факторов) связей. Коэффициент функциональной связности равен сумме коэффициентов корреляции, разделенной на произведение числа строк на количество столбцов. Этот статистический показатель для всей сети родников применим при сопоставлении разных территорий. Первое место как влияющий параметр занимает общее микробное число, а как зависимый показатель – цветность. Анализ всех 484 моделей показал, что высокой предсказательной силой обладают слабые и средние факторные связи. Они же зачастую приводят к научно-техническим решениям мировой новизны на уровне изобретений.
...
09 04 2026 15:47:45
Статья в формате PDF
122 KB...
07 04 2026 20:37:18
Предложено устранять внутриутробную гипоксию и асфиксию плода путем искусственной вентиляции его легких дыхательным газом. Для искусственного дыхания внутриутробного плода разработано специальное устройство, названное внутриматочным аквалангом. Внутриматочный акваланг включает аппарат искусственной вентиляции легких и дыхательный контур со специальной раскладной (раздувной) дыхательной маской, надеваемой внутри матки на голову плода наподобие сетчатого шлема. Разработана контролируемая с помощью УЗИ технология введения маски внутрь матки через естественное отверстие в шейке матки, технология одевания дыхательной маски на голову внутриутробного плода при головном его предлежании и технология вентилирования легких внутриутробного плода дыхательным газом.
...
06 04 2026 14:59:32
Статья в формате PDF
111 KB...
05 04 2026 13:56:12
Статья в формате PDF
121 KB...
04 04 2026 15:42:22
Статья в формате PDF
140 KB...
03 04 2026 19:40:27
Статья в формате PDF
104 KB...
02 04 2026 11:22:26
Статья в формате PDF
106 KB...
31 03 2026 18:16:26
Статья в формате PDF
101 KB...
30 03 2026 16:54:32
Статья в формате PDF
140 KB...
28 03 2026 2:45:27
27 03 2026 22:37:21
Статья в формате PDF
251 KB...
26 03 2026 22:26:11
Рассмотрены основные составляющие познавательной системы профессора И.С.Мустафина, которая включает позитивное использование опыта негативных событий, а также применение оригинальных задач-рассказов и поэтического творчества для развития творческих и естественнонаучных способностей.
...
25 03 2026 12:12:40
Статья в формате PDF
116 KB...
24 03 2026 16:15:11
Статья в формате PDF
307 KB...
23 03 2026 2:57:58
22 03 2026 19:30:10
Статья в формате PDF
253 KB...
21 03 2026 21:57:42
Статья в формате PDF
139 KB...
20 03 2026 14:37:57
Статья в формате PDF
288 KB...
19 03 2026 9:33:36
Статья в формате PDF
125 KB...
18 03 2026 9:25:15
Статья в формате PDF
112 KB...
17 03 2026 8:21:51
Статья в формате PDF
112 KB...
16 03 2026 13:13:18
В экспериментах по микроэволюции генетически модифицированных бактерий (ГМО) при непрерывном культивировании показано, что при переходе от одного стационарного состояния к другому в открытой биологической системе скорость производства энтропии должна возрастать, а не уменьшаться, как следует из основных положений неравновесной термодинамики. С точки зрения термодинамики проточные культуры микроорганизмов – хемостат и турбидостат – это открытые термодинамические системы, способные находиться в устойчивых стационарных состояниях. Причем, в соответствии с классификацией М.Эйгена (1973), хемостат соответствует случаю постоянных потоков, а турбидостат – случаю постоянной организации. Несмотря на кажущееся разнообразие микроэволюционных переходов в двух типах открытых систем при их изучении обнаруживаются общие закономерности. Важнейшей из них является возрастание потока использованной популяциями свободной энергии, и, следовательно, возрастание теплорассеяния и скорости производства энтропии. Результаты свидетельствуют о необходимости дальнейшего развития термодинамической теории открытых биологических систем, дальнейшего изучения общих закономерностей биологического развития.
...
15 03 2026 23:47:39
Статья в формате PDF
151 KB...
13 03 2026 3:29:14
Статья в формате PDF
304 KB...
12 03 2026 0:10:25
Статья в формате PDF
142 KB...
11 03 2026 7:29:39
Медицинская пиявка (Hirudo medicinalis L.) относится к классу пиявок (Hirudinea) подклассу настоящих пиявок (Euhirudinea) отряду челюстных пиявок (Ghathobdellidae), роду Hirudo. Более 30 веков она использовалась человеком как лечебное средство. В России велик опыт клинического применения пиявки (гирудотерапия), его расцветом считаются 18-19 века, когда по экспорту пиявки Россия занимала место, равное злаковым культурам, что являлось существенной статьей дохода государственной казны. В статье показаны оптимальные условия среды для обитания медицинской пиявки и возможные лимитирующие факторы ее распространения и численности. Сегодня основной причиной снижения численности пиявки в Краснодарском крае является антропогенный фактор. Так бpaконьерский вылов Hirudo medicinalis привел к сильному подрыву ее популяции в большинстве районов Краснодарского края, по сравнению с серединой 90-х годов, ее численность снизилась до 10 раз. В 2002 г. губернатором Краснодарского края А.Н. Ткачевым было выпущено постановление №955 «Об изучении и сохранении медицинской пиявки на территории Краснодарского края». Важным условием сохранения медицинской пиявки в нашем крае является введение запрета на ее вылов на территории Ростовской области, куда в последнее время сместились рынки нелегальной торговли пиявкой. Идеальным вариантом стал бы запрет на ловлю пиявки во всем Южном федеральном округе и принятие коллективных мер по ее охране.
...
10 03 2026 3:14:33
В работе рассматривается влияние краткосрочной изоляции в течение пяти суток на поведение крыс в открытом поле. Показано, что у крыс, находящихся в изоляции, уменьшается время выхода из центра, снижается сумма дефекаций и уринаций. Показатели ориентировочно-исследовательской реакции при повторном тестировании изменялись одинаково у изолированных и групповых крыс.
...
08 03 2026 19:52:21
Статья в формате PDF
412 KB...
07 03 2026 2:12:39
Статья в формате PDF
110 KB...
06 03 2026 18:34:41
Статья в формате PDF
127 KB...
05 03 2026 18:39:53
Еще:
Поддержать себя -1 :: Поддержать себя -2 :: Поддержать себя -3 :: Поддержать себя -4 :: Поддержать себя -5 :: Поддержать себя -6 :: Поддержать себя -7 :: Поддержать себя -8 :: Поддержать себя -9 :: Поддержать себя -10 :: Поддержать себя -11 :: Поддержать себя -12 :: Поддержать себя -13 :: Поддержать себя -14 :: Поддержать себя -15 :: Поддержать себя -16 :: Поддержать себя -17 :: Поддержать себя -18 :: Поддержать себя -19 :: Поддержать себя -20 :: Поддержать себя -21 :: Поддержать себя -22 :: Поддержать себя -23 :: Поддержать себя -24 :: Поддержать себя -25 :: Поддержать себя -26 :: Поддержать себя -27 :: Поддержать себя -28 :: Поддержать себя -29 :: Поддержать себя -30 :: Поддержать себя -31 :: Поддержать себя -32 :: Поддержать себя -33 :: Поддержать себя -34 :: Поддержать себя -35 :: Поддержать себя -36 :: Поддержать себя -37 :: Поддержать себя -38 ::