Scientific journal
Advances in current natural sciences
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,775

ENVIRONMENTAL SAMPLING SCHEMES OPTIMIZATION IN HARD-TO-ACCESS ARCTIC AREAS: A STATISTICAL APPROACH

Miskevich I.V. 1 Kotova E.I. 1 Lokhov A.S. 1 Netsvetaeva O.P. 1, 2
1 Shirshov Institute of Oceanology Russian Academy of Sciences
2 Russian Arctic National Park
The Arctic is a hard-to-reach region. This circumstance significantly increases the cost and complexity of any research. Thus, it is necessary to collect the enough minimum number of samples for objective analysis in the shortest possible time. Paper investigates a question – what is the minimum sampling number required to obtain reliable research? We chose the number three proposed by John Tukey as the minimum sample number in environmental research. John Tukey argued that statistics begin with three analyzed numbers. To test this hypothesis, we studied the statistical characteristics (arithmetic mean, median, Tukey’s trimean) for selections with different sizes (from 2 to 20 values). We use three different selections of environmental data. This is suspended matter concentration in snow and water as well as water oxygen saturation in the Kyanda river mouth (White Sea). According to calculation, it conclude that with increase of the selections size arithmetic mean variability increase and the median variability decrease. Paper describes calculation of the Student’s t-test possible variability range for arbitrary small samples. Paper gives recommendations to collect at least three samples of various components taking into account them variability. For example to investigate hydrological and hydrochemical characteristics of the tidal river mouths we recommend to collect at least three sample for each tidal phase. Because most of these characteristics are periodical. According to variability of these characteristics, samples need to be taken in at least three places with pay attention to river marginal filter specialties.
monitoring
Arctic
sampling optimization
statistic
environmental science

При исследовании природных объектов на арктических территориях в условиях отсутствия развитой транспортной инфраструктуры продолжительные и масштабные наблюдения требуют очень больших финансовых и технических затрат. С одной стороны, для объективного анализа изучаемого процесса должно быть выполнено большое количество наблюдений, с другой – время для проведения наблюдений должно быть очень коротким.

missing image file

Рис. 1. Изменчивость критерия Стьюдента при доверительной вероятности в 95% для различной длины выборки данных

В первую очередь, это касается арктических островов и труднодоступных территорий, где для проведения исследований обычно необходимо применять вертолеты, ограниченные полетным временем. Определенные ограничения подобного рода возникают в морских экспедициях при высадке экспедиционного отряда на берег на шлюпке с борта морского судна для проведения серии наблюдений.

Наличие ограничений по объему возможных перевозимых грузов также накладывает ограничения на возможности объема пробоотбора. В данных ситуациях возникает вопрос определения оптимального количества необходимых наблюдений, а также достаточного объема проб, которые будут подлежать транспортировке.

В итоге должен быть найден определенный компромисс, который позволяет получать достоверную статистическую оценку изучаемого процесса при минимуме финансовых и технических затрат на проведение геоэкологических наблюдений. Он должен базироваться на определении минимального количества наблюдений, позволяющего достичь поставленных научных и (или) прикладных задач.

Известный американский математик Джон Тьюки утверждал, что статистика начинается с наличия трех анализируемых цифр [1]. Действительно, три значения, в отличие от двух значений, при проведении статистической обработки уже позволяют проводить как оценку масштаба положения (среднеарифметическое значение, медиана и т.п.), так и оценку масштаба изменчивости (стандартное отклонение, межквартильный размах и т.п.). При этом число «три» позволяет проводить такую обработку как с помощью стандартных параметров при гипотезе сохранения нормального закона распределения данных, так и с использованием робастных статистик без учета его наличия [2].

В пользу указанного числа также говорит связь критерия Стьюдента с длиной используемой выборки данных. С трех цифр выборки начинается плавное понижение его величины (рис. 1), что снижает погрешность производимых статистических расчетов.

Исследования в данном направлении, проведенные в системе Росгидромета в конце прошлого века для гидролого-гидрохимических рядов наблюдений, позволили дать следующие рекомендации [2; 3]:

− при длине выборки пять наблюдений и меньше лучше использовать медиану;

− при длине выборки более пяти наблюдений целесообразно использовать трехсреднее значение.

Напомним, что медиана разделяет ранжированную выборку данных пополам и определяется по формуле (1):

missing image file (1)

где n – количество данных в выборке. Отметим, что в данном случае для расчетов использовалась её интегральная форма.

Трехсреднее значение находится по выражению (2):

С3ср = 0,25(С0,25 + 2СМ + С0,75), (2)

где С0,25 и С0,75 – квартили, или, другими словами, медианы для половинок выборки.

Интерквартильный размах, который может выступать в качестве оценки изменчивости, определяется по формуле (3):

Н = С0,75 – С0,25. (3)

Однако вышеуказанные рекомендации были получены на основе исследований выборок температуры воды и солености, которые, в отличие от многих геоэкологических параметров, обладают большей консервативностью в пределах внутрисезонных колебаний и не имеют прямой зависимости от техногенного влияния. Последнее может сформировать даже внутри малой выборки значения, отличающиеся друг от друга на 1–3 порядка.

Материалы и методы исследования

Для проверки выбора числа «три» в качестве минимального объема для геоэкологических наблюдений были исследованы статистические характеристики различных параметров для выборок данных различного размера. Рассматривались приведенные ниже параметры.

− Высота снежного покрова на метеостанции «Холмогоры» Приморского района Архангельской области. Побережье Белого моря находится в зоне активной циклонической деятельности, которая наиболее интенсивна осенью и зимой. Высота снежной толщи, помимо количества выпавших осадков, зависит от многих факторов, в частности от наличия оттепелей, которые могут приводить к уплотнению снежной толщи. В результате значения характеристик снежной толщи меняются в широком диапазоне год от года [4].

− Содержание взвешенных веществ в снежном покрове в Приморском районе Архангельской области в марте 2019 года. Вследствие многофакторности процесса формирования состава снежного покрова содержание веществ в снеге имеет значительную пространственную и временную неоднородность [5].

− Содержание взвешенных веществ в воде и степень насыщенности вод кислородом (кислородонасыщение) в зоне смешения речных и морских вод в устье р. Кянды в юго-восточной части Онежского залива Белого моря в августе 2016 года. Воды этого объекта обладают большой изменчивостью геоэкологических характеристик за счет короткопериодной приливной изменчивости фронтального раздела между пресными и солеными водами при наличии антропогенного влияния, т.к. водосбор устья р. Кянды располагается в зоне дренируемых сельскохозяйственных угодий (в период исследований здесь производилась заготовка сена и выпас скота) [6].

Результаты исследования и их обсуждение

Результаты статистических исследований показаны на рисунке 2 и в таблице.

Анализ полученных материалов показал, что данные по высоте снежного покрова распределены по нормальному закону, поэтому их статистическая интерпретация стандартным методом дает результаты не хуже, чем робастный подход. В рамках данной статьи далее они не рассматривались.

Характеристика размаха различных оценок масштаба положения для геоэкологических характеристик при изменении объема наблюдений

Показатель

N

Смакс. – Смин.

Сср.

СМ

С3ср.

Содержание взвеси

в снеге, мг/л

12

2,20

1,34

1,57

Содержание взвеси в водах устья р. Кянды

20

8,8

4,4

5,1

Кислородонасыщение вод устья р. Кянды

20

6,4

4,2

5,4

На рисунке 2 и в таблице для рассматриваемых показателей четко прослеживается максимальная изменчивость параметра Сср. и минимальная – параметра См по мере возрастания количества наблюдений (N).

Таким образом, при планировании геоэкологических исследований в труднодоступных арктических районах для снижения финансовых издержек рекомендуется ориентироваться на отбор минимум трех проб различных компонентов природной среды.

При статической обработке полученных данных в качестве критерия оценки величины необходимо использовать медиану. Она, в отличие от среднеарифметического значения, минимизирует погрешности, возникающие при значительном сокращении количества отбираемых проб воды, снега (льда) и почвы (донных отложений).

В рамках рассматриваемой проблемы также можно дать рекомендации по минимальному количеству отбираемых проб при изучении маргинальных фильтров в устьях рек Северного Ледовитого океана. Напомним, что, согласно модели маргинального фильтра академика Лисицына А.П., в зоне устьевых вод по мере возрастания солености формируется три последовательные зоны: мутьевая, геохимическая и биологическая «пробки» [7].

missing image file

Рис. 2. Изменчивость статистик: Сср. – среднеарифметическое значение, См – медиана, С3ср. – трехсреднее значение, N – количество наблюдений) для: а) содержания взвеси в пробах снега; б) содержания взвеси в водах устья р. Кянды; в) кислородонасыщения вод устья р. Кянды

В первой из них фиксируются максимальные концентрации взвеси, во второй зоне отмечается наибольшая интенсивность геохимических процессов, а в третьей – повышенная биопродуктивность морских вод. Например, в Белом море первой зоне соответствует интервал солености в 0,5–5‰, второй зоне – 5–20‰ и третьей зоне – соленость более 20‰ [8; 9].

Минимальное количество отбираемых проб при изучении маргинальных фильтров в устьях рек Северного Ледовитого океана составляет по три пробы в каждой из вышеперечисленных зон, тогда их общий минимум равняется 9.

Помимо этого, необходимо учитывать особенности конкретных геоэкологических показателей, например при исследовании содержания взвесей в водах с явно выраженными приливно-отличными явлениями минимум составит 3 пробы в каждой зоне на каждую фазу прилива/отлива. Это число уже позволяет проводить необходимый корреляционный и регрессионный анализ полученных данных. Данная задача особенно актуальна для отбора воды и донных отложений на анализ дорогостоящих ингредиентов (ртуть, ХОП, ПХБ, диоксины и т.п.) [10].

Заключение

Анализ статистических характеристик для выборок геэкологических данных различного размера показал, что при планировании геоэкологических исследований в труднодоступных арктических районах для снижения финансовых издержек рекомендуется ориентироваться на отбор минимум трех проб каждого из компонентов природной среды.

В качестве критерия оценки параметра необходимо использовать медиану, которая минимизирует погрешности, возникающие при значительном сокращении количества отбираемых проб.

При отборе проб следует учитывать особенности конкретных геоэкологических показателей и проводить три отбора в разных условиях, что кратно увеличит количество наблюдений.