?

Log in

No account? Create an account

Ulrich, Gotelli, 2007a
covtoc
basil_yakimov
Ulrich W., Gotelli N.J., 2007. Null model analysis of species nestedness patterns // Ecology. 88: 1824–1831.
В данной работе проведено сравнительное исследование методов статистического анализа вложенности. Авторы собрали 8 различных метрик (6 мер на основе пропусков, мера несоответствий и матричная температура, для последней приводится слегка модифицированный в сторону упрощения алгоритм расчета) и 6 схем рандомизации (включая стандартные EE, FF, EF, FE). Статистический анализ проводился по стандартной схеме, когда для матрицы рассчитывается метрика Eobs, затем проводится большое число рандомизаций с теми или иными ограничениями и генерируются нуль-модельные матрицы, для каждой из которых рассчитывается значение метрики. Среднее Eexp и стандартное отклонение σexp распределения значений метрики в нуль-модели используется в трансформации Z = (Eobs – Eexp)/σexp. Статистическая значимость вложенности определяется на основании распределения в нуль-модели: если Eobs выходит за пределы 95 %-го интервала, то вложенность признается достоверной.
Различные комбинации метрик и нуль-моделей проверялись на трех наборах матриц: (1) сгенерированные вложенные матрицы разной формы, размера и заполненности; (2) сгенерированные случайные матрицы; (3) набор из 288 эмпирических матриц (собраны Атмаром и Паттерсоном в 1995 году, прицеплены к их калькулятору матричной температуры).
При анализе случайных матриц выявление вложенности является ошибкой первого рода. По этому показателю поведение практически всех схем рандомизации оказалось удручающе плохим: для схемы EE от 58 % до 97 % ошибок (в зависимости от метрики), еще для 4 схем доля ошибок варьирует от 19 % до 96 %. Только максимально ограниченная схема FF показала приемлемый результат: 4-7 % ошибок.
При анализе вложенных матриц ожидаемо выявлена обратная тенденция. Наибольший процент выявления вложенности показала схема EE (78-98 %). Хуже всего проявила себя схема FF: только от 2 % до 41 % матриц признаны вложенными. В рамках схемы FF лучше всего показала себя метрика N1 (число присутствий видов в столбцах с меньшим богатством по сравнению с наибольшим, в котором данный вид отсутствует) – 41 %.
Итоговый вывод из этих результатов сводится к тому, что несмотря на ультра-консервативность схемы FF применение других схем крайне рискованно ввиду неадекватного уровня ошибок первого рода. Высокая вероятность ошибок второго рода (слабая мощность) не является критичным недостатком статистического метода, а вот зашкаливающая вероятность ошибки первого рода – очень даже является.
Итоги применения разных схем анализа к эмпирическим матрицам также неутешительны: неконсервативные нуль-модели выявляют вложенность для 28-80 % матриц, а консервативная модель FF только для 7-18 % (в зависимости от метрики). Отсюда следует, что ранее полученные данные о широком распространении вложенности в эмпирике могут быть следствием неадекватного статистического аппарата. Авторы призывают к особой осторожности при работе со старыми результатами, а по возможности – к повторному анализу.
Отдельный раздел работы посвящен зависимости различных метрик вложенности от параметров матрицы: размера, формы, заполненности, а также максимальной разницы в видовом богатстве между столбцами. Для этого проводился корреляционный анализ зависимости Z-трансформированных значений метрик от параметров вложенных матриц (первый набор) в условиях нуль-модели FF. Для разных метрик и разных параметров выявлено большое число достоверных корреляций (как положительных, так и отрицательных). В этом отношении лучше всего себя показала метрика несоответствий (максимальный коэффициент корреляции 0.18, достоверных нет) и индекс неожиданных присутствий/отсутствий.
Таким образом, авторы рекомендуют для статистического анализа вложенности использовать метрику несоответствий в сочетании с консервативной нуль-моделью FF. При определенной осторожности можно использовать метрику N1, но необходимо учитывать ее зависимость от размеров матрицы и разницы в видовом богатстве.
Наиболее широко применяемая метрика вложенности – матричная температура – какими-либо преимуществами в плане статистического анализа не обладает.