?

Log in

No account? Create an account

Previous Entry Share Next Entry
Schmera et al., 2018
covtoc
basil_yakimov
Schmera D., Podani J., Botta-Dukát Z., Erős T., 2018. On the reliability of the Elements of Metacommunity Structure framework for separating idealized metacommunity patterns // Ecological Indicators. 85: 853–860.
Статья посвящена обстоятельной критике подхода к анализу матриц встречаемости видов (виды × пробы), который известен как «Элементы структуры метасообщества» (Elements of Metacommunity Structure, EMS). В основе этого подхода, предложенного М. Лэйболдом и Г. Миккельсоном (Leibold, Mikkelson, 2001), лежит идея анализа упорядочивания матрицы встречаемостей вдоль некого градиента. Это может быть градиент одного из ключевых факторов среды (например, увлажнение), который измерен для каждой пробы. Тогда пробы упорядочиваются в соответствии со значениями этого фактора. Если средовых данных нет, либо неизвестно какой из факторов считать ключевым, то можно косвенным образом выделить градиент на основе самой матрицы встречаемости. В этом случае проводится анализ соответствий (концептуально это аналог анализа главных компонент для качественных данных), после чего пробы и виды упорядочиваются вдоль первой оси ординации (пробы – в соответствии со значениями, виды – по весовым коэффициентам). Предполагается, что первая ось ординации отражает ключевой градиент зависимости проб от факторов среды в обобщенном виде. После упорядочивания, в случае наличия существенной зависимости от рассматриваемого градиента, присутствия видов (единицы) концентрируются вдоль главной диагонали матрицы, причем в случае идеального градиента диапазоны присутствия видов формируют серии единиц, которые смещаются вправо вдоль главной диагонали. Такую упорядоченность Лэйболд и Миккельсон называют когерентностью.
Дальнейший анализ заключается в применении трех последовательных статистических тестов на основе трех метрик. Первый тест выявляет собственно наличие когерентности, то есть упорядоченности вдоль основной оси варьирования. В качестве метрики здесь используется число «внутренних отсутствий» (embedded absences), то есть ситуаций, когда внутри диапазона распространения данного вида присутствуют пропуски, а также когда есть пропуски в упорядоченном наборе видов для данной пробы. Такие отсутствия нарушают когерентность. Двойные пропуски (когда отсутствие вида является внутренним и по столбцу, и по строчке) учитываются при подсчете один раз. Если число внутренних отсутствий меньше ожидаемого в нуль-модели, то структура такой матрицы соответствует паттерну «шахматной доски», когда в сообществе преобладают сегрегированные пары виды. Отсутствие статистически значимой когерентности будет соответствовать случайной структуре матрицы встречаемости. Если же когерентность выявлена (эмпирические число внутренних пропусков больше ожидаемого в нуль-модели), то анализируется паттерн замены видов (turnover). В качестве метрики здесь фактически используется метрика C-score (Stone, Roberts, 1990), то есть число подматриц 2 × 2, соответствующих замене одного вида другим в паре проб. Если эта метрика будет значимо меньше по сравнению с нуль-моделью, то матрица считается вложенной, если больше – то агрегированной. Агрегированные матрицы подвергаются третьему тесту, выявляющему паттерны агрегации границ (boundary clumping). При этом предполагается, что распространения видов вдоль градиента косвенно отражают экологическую нишу вида. Тогда можно различить три структуры: (1) глизоновскую, когда границы ниш распределены независимо между видами, (2) клементсовскую, когда положение границ агрегировано, то есть существуют отчетливо выраженные границы между сообществами, (3) равномерную, когда положение границ распределено неслучайно, но равномерно. Для различения этих трех структур используется индекс Мориситы (Morisita, 1970). Все три статистических теста осуществляются с применением нуль-модели. Лейболд и Миккельсон предложили использовать модели EE и FF (там в статье номенклатура другая, но смысл такой), особо указывая на ненадежность первой и консервативность второй.
Аналитический подход EMS был доработан С. Пресли и коллегами (Presley et al., 2010), которые добавили к исходному подходу два элемента. Во-первых, они предложили анализировать агрегацию границ не только для агрегированных матриц по метрике C-score, но и для вложенных матриц. В последнем случае анализ агрегации границ может детализировать структуру вложенности и выявить паттерны случайной, агрегированной и рассредоточенной потери видов. Во-вторых, эти авторы отказались от нуль-модели FF как от излишне консервативной и перешли к использованию промежуточной модели EF, которая накладывает ограничение только на видовое богатство пробы.
В обсуждаемой работе подход EMS критикуется венгерским авторским коллективом с трех позиций: теоретической, симуляционной и с точки зрения реализации EMS в прикладных исследованиях.
Теоретические претензии следующие. В рамках EMS допускаются два варианта упорядочивания матрицы встречаемости: по эмпирическому градиенту и по первой оси анализа соответствий. Во втором случае упорядочиваются как пробы, так и виды, в первом же – только пробы. Однако при расчете метрики когерентности важен порядок как проб, так и видов. Соответственно упорядочивание по эмпирическому градиенту ведет к неоднозначным результатам, поскольку порядок видов в этом случае будет произвольным. Авторы также отрицают возможность анализа агрегации границ для косвенным образом выделенного градиента по результатам анализа соответствий.
Другое направление критики – несоответствие терминологии современному варианту. Так, противоположную когерентности структуру в EMS называют «шахматной доской». Авторы подчеркивают, что этот термин восходит к Джареду Даймонду (Diamond, 1975), который под «шахматной доской» понимал абсолютно сегрегированное распределение пары видов, когда они никогда не встречаются совместно. То есть эта концепция исходно является свойством распределения пары видов, а не целой матрицы встречаемости. Для прояснения этого вопроса авторы сгенерировали большое количество случайных матриц и провели для каждой EMS-анализ, а также рассчитали число сегрегированных пар видов и проанализировали его с помощью нуль-модели. Выяснилось, что матрицы с отрицательной когерентностью по EMS только в 4.24 % соответствовали матрицам с повышенной доле сегрегированных пар.
Аналогичным образом авторы продемонстрировали проблему подхода EMS с выявлением вложенности. В EMS вложенность в явном виде противопоставляется паттерну замены видов. В современных же условиях для выявления вложенности чаще всего используется отдельный индекс NODF (Almeida-Neto et al., 2008). Анализ случайных матриц показал, что высоким значениям C-score (метрика замены видов) чаще всего соответствуют низкие значения вложенности, но вот низким значениям C-score могут соответствовать любые значения вложенности. То есть эти две концепции не являются противоположными. Анализ на основе нуль-моделей показал, что из матриц, в которые EMS распознается паттерн замены видов, только для 5.6 % выявляется статистически значимая «отрицательная» вложенность.
С помощью симуляций авторы также исследовали статистические свойства EMS. За основу брались искусственные матрицы с одним из паттернов, которые должен диагностировать EMS. В эти матрицы добавлялся элемент случайных перестановок, то есть шума. Исследовалась доля верных распознаваний. Показано, что доля распознаваний большинства паттернов падает меньше 50 % уже при 20 %-ном уровне шуму, а для некоторых – уже при 5 %-ном шуме. Причем при малой доел шума часто выявляется не случайный характер матрицы, а какой-то другой паттерн, то есть происходит ошибка первого рода.
Авторы также критикуют сложившуюся практику использования EMS, когда после использования анализа соответствий не приводится доля дисперсии, объясняемой первой осью. Авторы подчеркивают, что принципиально важна высокая доля этой дисперсии. Иначе анализируемый градиент просто недостаточно выражен и сам анализ теряет смысл. В единственной работе из 26 указанная доля была приведена и составила от 17.7 % до 24 %.
Я склонен согласиться с большинством аргументов авторов. Подход EMS представляется мне несколько устаревшим. Он был предложен, когда концепции сегрегации, вложенности, замены видов, а также методология их анализа на основе нуль-моделей еще не до конца сложились. В общем и целом, я бы не счел этот подход очень сильно популярным. Думаю, что такое внимание к нему связано с тем, что относительно недавно сторонники этого подхода выпустили пакет metacom для среды R (Dallas, 2014), в котором реализованы процедуры EMS, что может привести к всплеску его использования.