Неориентированные и ориентированные графы. Для эффективного выделения скоплений объектов существуют методы сетевого анализа. Сетевой анализ матрицы оценок сходства между объектами заключается в построении некоторых типов графов, т.е. диаграмм, где объекты изображены в виде точек (кружков) – вершин графа, которые соединяются или не соединяются линиями, называемыми ребрами графа. Степень соответствия между объектами отражается в графах или характером взаимного расположения точек, или длиной и другими особенностями линии, соединяющих точки.
При анализе матриц сходства обычно используются «неориентированные графы», в которых линии, соединяющие вершины графа, не имеют направления. Реже применяются «ориентированные графы», в которых вершины соединены стрелками. Дендрит – один из типов неориентированного графа. Он может быть как: минимальное древо (матрица включает оценки различий между объектами) или максимальное древо (используются меры сходства). Дендрит – это ломаная линия, которая может ветвиться, но не содержит циклов. Построение дендрита заключается в нахождении для каждого объекта наиболее сходного с ним объекта и соединении их линией. В результате получается ряд отрезков, в том числе и разветвленных.
Построить дендрит можно с помощью матрицы сходства выборочных совокупностей, например (А–Е), вычисленной на основе индекса сходства Жаккара. Для этого последовательно соединяем две наиболее сходные выборки Г и Д (0,9) отрезком. Следующая по силе величина сходства 0,85 обнаружена между выборками Г и В. Поэтому выборку В можно присоединить отрезком к уже построенной ветке Д – Г и т. д. (рис. 5).
Рис. 5. Последовательные этапы построения дендрита
на основе матрицы сходства выборок.
Рис. 6. Дендрит сходства ценофлор синтаксонов широколиственных лесов Судость-Деснянского междуречья (Семенищенков, 2005).
Обозначения синтаксонов: M-Q t – Mercurialo perennis – Quercetum roboris typicum, M-Q f – M. p. – Q. fraxinetosum excelsioris; G-Q t – Geo rivali – Quercetum roboristypicum, G-Q d – G. r. – Q.deschampsietosum cespitosi; L-Q t – Lathyro nigri – Quercetum roboristypicum, L-Q l – L. n. – Q. laserpitietosum latifoliae; F-Q – Filipendulo ulmariae – Quercetum roboris; C-Q – Carici elongatae – Quercetum roboris ass., V-Q – Vaccinio myrtilli – Quercetum roboris. Верхний индекс: числитель – число описаний, знаменатель – количество видов в ценофлоре синтаксона. У соединительных линий – значения индекса Съеренсена.
Основной недостаток такого графика – потеря информации, заключенной в матрице оценок сходства, в результате использования только немногих (максимальных для каждого объекта) значений показателя соответствия.
Плеяды Терентьева. Одним из видов графического анализа сходства выборок может быть построение плеяд Терентьева (рис. 7). Этот тип графика в отличие от дендрита учитывает всюматрицу сходства. Плеяды Терентьева можно построить с помощью матрицы флористического сходства, вычисленной на основе индекса сходства Жаккара.
Рис. 7. Такой тип графика является неориентированным графом. На нем все объекты могут быть соединены линиями, отражающими связи и меру сходства объектов. Толщина или характер линий соответствуют определенному интервалу значений:
Рис. 8. Один из типов плеяд Терентьева.
Взаимосвязи между объектами показаны на уровнях сходства 0,8; 0,5 и 0,2
Дендрограмма (кластерный анализ). Если сравнивать несколько участков, хорошее представление о бета-разнообразии может дать кластерный анализ.
Кластерный анализ – один из методов многомерного анализа, сущность которого состоит в иерархической классификации объектов в разделении множества объектов на однородные группы. Графически иерархическая классификация отображается в виде дендрограммы (дерева).
Внутри каждой группы, получаемой в результате разбиения объектов на кластеры (группы), объекты более сходны, чем с объектами из других групп. Кластерный анализ начинается с составления матрицы сходства для каждой пары сравниваемых объектов. Затем проводится последовательное объединение объектов в группы по степени их сходства, пока все они не будут включены в одну группу. Поскольку интерпретация результатов кластерного анализа зависит от визуальной оценки дендрограммы, лучше всего использовать этот прием для небольшого количества данных.
Анализ включает следующие этапы:
1. Расчет коэффициентов флористического сходства и заполнение матрицы коэффициентов сходства по принципу:
№ синтаксона | |||
1,00 | 0,53 | 0,24 | |
0,53 | 1,00 | 0,13 | |
0,24 | 0,13 | 1,00 и т. д. |
2. Построение дендрограммы и ее анализ.
Сложные и разнообразные методы кластерного анализа обычно реализуются с помощью вычислительной техники. Разработано множество статистических пакетов программ, таких как Statgraphics, Statistica, STADIA и др., которые выполняют кластерный анализ.
Рис. 9. Дендрограмма флористического сходства синтаксонов древесной растительности Судость-Деснянского междуречья (Брянская область), построенная по методу одиночного присоединения (Семенищенков, 2006)
Ассоциации: 1 – Rhamno catharici – Cornetum sanguineae; 2 – Swido sanguineae – Ulmetum laevis; 3 – Mercurialo perennis-Quercetum roboris; 4 – Aceri platanoidis – Fraxinetum excelsioris; 5 – Geo rivali – Quercetum roboris; 6 – Corylo avellanae – Pinetum sylvestris; 7 – Urtico dioicae – Alnetum glutinosae;8 – Filipendulo ulmariae – Quercetum roboris;9 – Galio palustris – Quercetum roboris; 10 – Fraxino excelsioris – Salicetum fragilis; 11 – Swido albae – Salicetum fragilis; 12 – Salici albae – Ulmetum laevis;13 – Rhamno catharici – Ulmetum laevis;14 – Vaccinio myrtilli –Quercetum roboris; 15 – Lathyro nigri – Quercetum roboris;16 – Dicrano – Pinetum sylvestris;17 – Molinio caeruleae – Pinetum sylvestris;18 – Vaccinio uliginosi – Betuletum pubescentis;19 – Carici elongatae – Alnetum glutinosae;20 – Salicetum cinereae; 21 – Salicetum pentandro-cinereae; 22 – Salicetum triandrae; 23 – Salicetum albae; 24 – Agrosto vinealis – Salicetum acutifoliae.
В примере на рис. 9 дендрограмма позволила выявить блоки флористически сходных ассоциаций. Так, один кластер (асс. 7, 8, 9, 10, 11, 12, 20, 21, 22, 23) объединяет в основном гигрофитные и мезогигрофитые ассоциации; другой кластер (асс. 3, 4, 5, 6, 14, 15, 16, 17) – более мезофитные синтаксоны. Очевидны и «аутсайдеры» (асс. 18 и 24) – их ценофлора очень не похожа на все остальные.
Кластерный анализ широко применяется в современной геоботанике (Василевич, 1972; Миркин, Розенберг, 1978) и дает хорошее представление о бета-разнообразии (Лебедева и др., 2004). В последние годы этот метод постоянно применяется для изучения бета-разнообразия древесной и травяной растительности (Mucina, Brandes, 1985; Exner, Willner, 2002; Ермаков, 2003; Roleček, 2005 и мн. др.). Кластерный анализ выступает основой для множества нумерических классификаций, которые математически выстраивают синтаксономическую иерархию на основании флористического сходства ценофлор.