При исследовании природных объектов на арктических территориях в условиях отсутствия развитой транспортной инфраструктуры продолжительные и масштабные наблюдения требуют очень больших финансовых и технических затрат. С одной стороны, для объективного анализа изучаемого процесса должно быть выполнено большое количество наблюдений, с другой – время для проведения наблюдений должно быть очень коротким.
Рис. 1. Изменчивость критерия Стьюдента при доверительной вероятности в 95% для различной длины выборки данных
В первую очередь, это касается арктических островов и труднодоступных территорий, где для проведения исследований обычно необходимо применять вертолеты, ограниченные полетным временем. Определенные ограничения подобного рода возникают в морских экспедициях при высадке экспедиционного отряда на берег на шлюпке с борта морского судна для проведения серии наблюдений.
Наличие ограничений по объему возможных перевозимых грузов также накладывает ограничения на возможности объема пробоотбора. В данных ситуациях возникает вопрос определения оптимального количества необходимых наблюдений, а также достаточного объема проб, которые будут подлежать транспортировке.
В итоге должен быть найден определенный компромисс, который позволяет получать достоверную статистическую оценку изучаемого процесса при минимуме финансовых и технических затрат на проведение геоэкологических наблюдений. Он должен базироваться на определении минимального количества наблюдений, позволяющего достичь поставленных научных и (или) прикладных задач.
Известный американский математик Джон Тьюки утверждал, что статистика начинается с наличия трех анализируемых цифр [1]. Действительно, три значения, в отличие от двух значений, при проведении статистической обработки уже позволяют проводить как оценку масштаба положения (среднеарифметическое значение, медиана и т.п.), так и оценку масштаба изменчивости (стандартное отклонение, межквартильный размах и т.п.). При этом число «три» позволяет проводить такую обработку как с помощью стандартных параметров при гипотезе сохранения нормального закона распределения данных, так и с использованием робастных статистик без учета его наличия [2].
В пользу указанного числа также говорит связь критерия Стьюдента с длиной используемой выборки данных. С трех цифр выборки начинается плавное понижение его величины (рис. 1), что снижает погрешность производимых статистических расчетов.
Исследования в данном направлении, проведенные в системе Росгидромета в конце прошлого века для гидролого-гидрохимических рядов наблюдений, позволили дать следующие рекомендации [2; 3]:
− при длине выборки пять наблюдений и меньше лучше использовать медиану;
− при длине выборки более пяти наблюдений целесообразно использовать трехсреднее значение.
Напомним, что медиана разделяет ранжированную выборку данных пополам и определяется по формуле (1):
(1)
где n – количество данных в выборке. Отметим, что в данном случае для расчетов использовалась её интегральная форма.
Трехсреднее значение находится по выражению (2):
С3ср = 0,25(С0,25 + 2СМ + С0,75), (2)
где С0,25 и С0,75 – квартили, или, другими словами, медианы для половинок выборки.
Интерквартильный размах, который может выступать в качестве оценки изменчивости, определяется по формуле (3):
Н = С0,75 – С0,25. (3)
Однако вышеуказанные рекомендации были получены на основе исследований выборок температуры воды и солености, которые, в отличие от многих геоэкологических параметров, обладают большей консервативностью в пределах внутрисезонных колебаний и не имеют прямой зависимости от техногенного влияния. Последнее может сформировать даже внутри малой выборки значения, отличающиеся друг от друга на 1–3 порядка.
Материалы и методы исследования
Для проверки выбора числа «три» в качестве минимального объема для геоэкологических наблюдений были исследованы статистические характеристики различных параметров для выборок данных различного размера. Рассматривались приведенные ниже параметры.
− Высота снежного покрова на метеостанции «Холмогоры» Приморского района Архангельской области. Побережье Белого моря находится в зоне активной циклонической деятельности, которая наиболее интенсивна осенью и зимой. Высота снежной толщи, помимо количества выпавших осадков, зависит от многих факторов, в частности от наличия оттепелей, которые могут приводить к уплотнению снежной толщи. В результате значения характеристик снежной толщи меняются в широком диапазоне год от года [4].
− Содержание взвешенных веществ в снежном покрове в Приморском районе Архангельской области в марте 2019 года. Вследствие многофакторности процесса формирования состава снежного покрова содержание веществ в снеге имеет значительную пространственную и временную неоднородность [5].
− Содержание взвешенных веществ в воде и степень насыщенности вод кислородом (кислородонасыщение) в зоне смешения речных и морских вод в устье р. Кянды в юго-восточной части Онежского залива Белого моря в августе 2016 года. Воды этого объекта обладают большой изменчивостью геоэкологических характеристик за счет короткопериодной приливной изменчивости фронтального раздела между пресными и солеными водами при наличии антропогенного влияния, т.к. водосбор устья р. Кянды располагается в зоне дренируемых сельскохозяйственных угодий (в период исследований здесь производилась заготовка сена и выпас скота) [6].
Результаты исследования и их обсуждение
Результаты статистических исследований показаны на рисунке 2 и в таблице.
Анализ полученных материалов показал, что данные по высоте снежного покрова распределены по нормальному закону, поэтому их статистическая интерпретация стандартным методом дает результаты не хуже, чем робастный подход. В рамках данной статьи далее они не рассматривались.
Характеристика размаха различных оценок масштаба положения для геоэкологических характеристик при изменении объема наблюдений
Показатель |
N |
Смакс. – Смин. |
||
Сср. |
СМ |
С3ср. |
||
Содержание взвеси в снеге, мг/л |
12 |
2,20 |
1,34 |
1,57 |
Содержание взвеси в водах устья р. Кянды |
20 |
8,8 |
4,4 |
5,1 |
Кислородонасыщение вод устья р. Кянды |
20 |
6,4 |
4,2 |
5,4 |
На рисунке 2 и в таблице для рассматриваемых показателей четко прослеживается максимальная изменчивость параметра Сср. и минимальная – параметра См по мере возрастания количества наблюдений (N).
Таким образом, при планировании геоэкологических исследований в труднодоступных арктических районах для снижения финансовых издержек рекомендуется ориентироваться на отбор минимум трех проб различных компонентов природной среды.
При статической обработке полученных данных в качестве критерия оценки величины необходимо использовать медиану. Она, в отличие от среднеарифметического значения, минимизирует погрешности, возникающие при значительном сокращении количества отбираемых проб воды, снега (льда) и почвы (донных отложений).
В рамках рассматриваемой проблемы также можно дать рекомендации по минимальному количеству отбираемых проб при изучении маргинальных фильтров в устьях рек Северного Ледовитого океана. Напомним, что, согласно модели маргинального фильтра академика Лисицына А.П., в зоне устьевых вод по мере возрастания солености формируется три последовательные зоны: мутьевая, геохимическая и биологическая «пробки» [7].
Рис. 2. Изменчивость статистик: Сср. – среднеарифметическое значение, См – медиана, С3ср. – трехсреднее значение, N – количество наблюдений) для: а) содержания взвеси в пробах снега; б) содержания взвеси в водах устья р. Кянды; в) кислородонасыщения вод устья р. Кянды
В первой из них фиксируются максимальные концентрации взвеси, во второй зоне отмечается наибольшая интенсивность геохимических процессов, а в третьей – повышенная биопродуктивность морских вод. Например, в Белом море первой зоне соответствует интервал солености в 0,5–5‰, второй зоне – 5–20‰ и третьей зоне – соленость более 20‰ [8; 9].
Минимальное количество отбираемых проб при изучении маргинальных фильтров в устьях рек Северного Ледовитого океана составляет по три пробы в каждой из вышеперечисленных зон, тогда их общий минимум равняется 9.
Помимо этого, необходимо учитывать особенности конкретных геоэкологических показателей, например при исследовании содержания взвесей в водах с явно выраженными приливно-отличными явлениями минимум составит 3 пробы в каждой зоне на каждую фазу прилива/отлива. Это число уже позволяет проводить необходимый корреляционный и регрессионный анализ полученных данных. Данная задача особенно актуальна для отбора воды и донных отложений на анализ дорогостоящих ингредиентов (ртуть, ХОП, ПХБ, диоксины и т.п.) [10].
Заключение
Анализ статистических характеристик для выборок геэкологических данных различного размера показал, что при планировании геоэкологических исследований в труднодоступных арктических районах для снижения финансовых издержек рекомендуется ориентироваться на отбор минимум трех проб каждого из компонентов природной среды.
В качестве критерия оценки параметра необходимо использовать медиану, которая минимизирует погрешности, возникающие при значительном сокращении количества отбираемых проб.
При отборе проб следует учитывать особенности конкретных геоэкологических показателей и проводить три отбора в разных условиях, что кратно увеличит количество наблюдений.
Библиографическая ссылка
Мискевич И.В., Котова Е.И., Лохов А.С., Нецветаева О.П. ОПТИМИЗАЦИЯ СХЕМ ОТБОРА ГЕОЭКОЛОГИЧЕСКИХ ПРОБ В ТРУДНОДОСТУПНЫХ АРКТИЧЕСКИХ РАЙОНАХ: СТАТИСТИЧЕСКИЙ ПОДХОД* // Успехи современного естествознания. – 2023. – № 1. – С. 58-62;URL: https://natural-sciences.ru/ru/article/view?id=37985 (дата обращения: 23.11.2024).