Scientific journal
Advances in current natural sciences
ISSN 1681-7494
"Перечень" ВАК
ИФ РИНЦ = 0,775

Mazurkin P.M.
Освоение эффективной методологии статистического моделирования предлагается вести на принципиально новой эвристико-математи-ческой основе с использованием статистических данных, представляемых в виде табличных моделей. Основная методологическая трудность заключается в понимании сущности эвристико-математического подхода, диаметрально противоположного существующей теории аппроксимации и классической статистики. Цикл статей посвящен сущности и применению биотехнического закона как обобщения известных устойчивых законов распределения.

Предлагаемая методика эвристико-математической идентификации обобщенного устойчивого закона распределения [1-20], названного нами биотехническим законом, позволяет при минимуме затрат на обработку исходных управленческих, производственных, экологических, экономических или иных количественных данных достичь максимального результата в выработке научных и практических рекомендаций, а также в ходе моделирования получать новые идеи для составления заявок на изобретения.

Эвристико-статистическое моделирование - это интерактивный процесс получения математических формул (уравнений, неравенств) и их комплексов (как правило аддитивных) на основе исходных статистических данных, количественно выраженных в табличной форме, и их эвристического осмысления, а также содержательного каркаса (концептуальной модели) этой таблицы. При этом ограничение по количеству учитываемых переменных и показателей, формирующих структуру комплекса математических формул, принципиального значения не имеет, так как современные ПЭВМ, в особенности суперЭВМ петафлопного класса, значительно снижают уровни сложности в вычислениях.

Исходная структура формулы, а также конструкция математической модели из множества формул, прорабатываются эвристическими методами еще до начала первой итерации вычислений. В последующих циклах происходит уточнение (усложнение или упрощение) математических конструктов и уточнение (добавление или изъятие) исходных статистических данных. Таким образом, неформальные (эвристические) и формальные (вычислительно-математические) действия человека-исследователя выполняются всегда совместно или последовательно в виде цепи процедур. Это позволяет специалисту, то есть автору исследований, провести моделирование без помощи математика.

Применение устойчивых законов существенно упрощает выполнение эвристических действий, так как уверенность исследователя в применимости биотехнического закона или принципа цикличности дает типовую конструкцию математической формулы. В ходе итераций моделирования приходится только адаптировать различными соотношениями (аддитивными, мультипликативными, смешанными) фреймы знаний (типовые математические конструкты).

В итоге процесс проектирования комплекса формул происходит по блочно-модульному принципу так же, как этот процесс выполняется при конструировании модульных машин. Только вместо реальных агрегатов и узлов в проектировании математических моделей используются модули в виде устойчивых законов. Причем подразумевается, что любое аналитическое выражение также является статистическим (закон Ома, закон Гука и др.) и для них показатель определенности равен единице.

Устойчивые законы распределения статистических данных, кем-то уже доказанные по их расширительной применимости, вмещают в себя эвристические возможности и тем самым значительно облегчают труд исследователя, моделирующего конкретное явление или процесс. Поэтому под словосочетанием «статистическое моделирование» понимается процесс структурно-параметрический идентификации устойчивых законов (модули) и их организаций (конструкции моделей из различных модулей).

Эвристическая идентификация тех или иных устойчивых законов распределения применительно к конкретным статистическим выборкам (многофакторное моделирование предполагает табличную форму данных) - это интуитивный процесс. Наш биотехнический закон и принцип цикличности, вмещая в себя многие целочисленные и вещественно-числовые устойчивые законы, позволяют не задумываться над их применимостью (или неприменимостью) к конкретным задачам.

Поэтому далее методику конструирования моделей не приводим, - она слишком специфична и зависит во многом от содержания задачи. Для этого студентам готовятся несколько учебных пособий. Поэтому в этой и последующих статьях основное внимание будет уделено эвристико-вычислительным аспектам, то есть собственно действиям преобразования табличной формы в математические модели на основе устойчивых математических законов.

Решение задачи моделирования. Под задачей Д. Пойа [5] понимает следующее: «задача предполагает необходимость сознательного поиска соответствующего средства для достижения ясно видимой, но непосредственно недоступной цели. Решение задачи означает нахождение этого средства». Очевидно, что там, где нет трудностей в поиске стратегий и результатов решения, то там нет и самой задачи.

Решение - это процесс, хотя часто, из-за двойственности смысла, это слово понимается и как результат. На входе процесса, в нашем случае статистического моделирования, находится матрица исходных данных (при однофакторном моделировании - статистическая выборка) и эвристическая модель представлений, гипотез, идей и мыслей о структуре (каркасе) взаимодействий между переменными (столбцами или строками матрицы). В более сложных случаях учитываются связи даже между отдельными значениями переменных (взаимная связность при отсутствии независимости между факторами), то есть между клетками матрицы данных.

Первое требование понятно всем, так как если нет данных, то существует только постановка задачи моделирования и необходимо собрать эти количественные данные, то есть сформировать матрицу данных. Конечно же, здесь возникает множество вариантов стратегий: во-первых, воспользоваться таблицами данных других исследователей; во-вторых, собрать то, что имеется и возможно иметь в данной информационной среде; в-третьих, провести планирование эксперимента по сбору данных c учетом возможностей предлагаемой нами методологии.

Вот тут то и подключается второе требование - это наличие содержательного описания матрицы данных. Без этого данные превращаются просто в неорганизованное множество чисел. Поэтому смысловые коды-отображения всегда, хотя бы на минимальном уровне (констатация фактов), должны быть в публикациях, отчетах и других информационных документах. Эти эвристические модели, представленные в текстовой форме на естественном языке, могут быть и неточными, даже иногда ложно объясняющими результаты наблюдений самим автором. В истории науки немало примеров, когда матрицы данных объяснялись другими гораздо позже их создателей. Ныне такая же ситуация сложилась во многих отраслях науки, когда огромные массивы количественных данных приводились и ныне приводятся только в табличных формах и они не могут быть промоделированы.

Таким образом, процесс сбора качественной и количественной информации зависит от постановки задачи, уровня компетентности исследователя и других факторов. Если стратегия моделирования основывается на «чужих» данных, то учитывается их достоверность и полнота по объемам понятий. Здесь жизнь идет по понятиям. Если достоверность предусматривает проведение дополнительных экспериментов, то вначале необходима максимально полная проработка концептуальной модели, то есть необходимо уделить внимание вначале эвристике (концепции) исходных данных.

Пусть матрица данных имеется. Применительно к этому случаю Р. Альсведе и И. Вегенер [5] отмечали, что «обычная для математика задача состоит в том, чтобы выработать некоторое предположение (рабочую гипотезу) и затем искать его доказательство или опровержение. Каждый математик обладает определенным запасом знаний, применяемых им отчасти сознательно, отчасти подсознательно». Из этого определения видно, что эвристика нужна и при структурно-параметрической идентификации уже заранее подготовленной исходной математической модели (конструкция представлена в общем виде, когда параметры модели еще не имеют числовых значений). Однако эта эвристика уже относится к мастерству математика, а не специалиста. Причем современные ПЭВМ имеют программные среды, исключающие мышление математика и автоматизированным образом аппроксимирующие какую-то из нескольких тысяч так называемых типовых моделей. В итоге получается так называемая ложная идентификация бессмысленными математическими структурами.

Теперь мы можем утверждать, что любая задача статистического моделирования, на этапах даже чисто математического исследования с использованием известных математических правил, требует цельного эвристико-математического подхода.

В ходе моделирования появляется новая апостериорная информация, относительно которой затем уточняется структура модели и корректируется матрица данных. Здесь уместно привести высказывание П. Эткинса [5]: «... высказывания, на первый взгляд совершенно не связанные между собой, оказываются иногда эквивалентными. Именно таким путем, как правило, познается новый круг явлений: мы, подобно мыши, понемногу «откусываем» от огромного пирога и начинаем «переваривать» его. Но, как известно, аппетит приходит во время еды, а стремление к познанию безгранично».

Вот так и происходит повышение качества создаваемых моделей за счет улучшения их адекватности к различным статистическим данным, роста полноты описания по росту частных случаев данного явления или процесса. Так произошло и с нами за три десятка лет при создании предлагаемой методологии идентификации биотехнического закона.

Куда направляются эти готовые статистические модели (на момент работы по моделированию) и где они используются: может при оптимизации исследуемого процесса, а может в качестве модуля в более сложные математические комплексы? Все эти вопросы только косвенно относятся к решению задачи моделирования (при аппроксимации стараются исходить из цели упрощения работы по оптимизации, что является нарушением требований адекватности). Биотехнический закон лает усложняющие конструкции производных от обобщенной формулы количественного представления части цикла.

Известно, что «успешное продвижение в количественном описании явлений всегда дает возможность для качественно нового проникновения в его сущность» [5]. Этот факт особенно примечателен и он означает, что в некотором объеме количественно-определенной информации уже изначально содержатся новые знания. Данные несут знания если, конечно, нет сомнений в достоверности самих данных. Вот это свойство эвристичности, например, количественных данных в табличной форме, необходимо использовать как важнейший ресурс в процессе пояснения и идентификации математической (статистической) модели.

Математическая модель - это абстрактное устройство для получения упорядоченного движения количественных данных из океана неупорядоченных сведений, как это происходит, например, в двигателе внутреннего сгорания, где из неупорядоченного движения атомов топлива при его сгорании получается упорядоченное движение поршня, далее передаточного и исполнительного механизмов некой машины.

Эвристический регрессионный анализ. Математическая модель в виде уравнения регрессии (или в виде систем уравнений и неравенств регрессии) является упорядоченной относительно прошлых количественных данных структурой. Причем эта упорядоченность создается исследователем, она зависит от его знаний и умений. Причем уравнения регрессии должны быть устойчивыми законами распределения, что полностью снимает проблему выбора конструкции модели.

Сами данные могут быть получены экспериментально или не экспериментально. Однако в любом случае все это - прошлая количественная информация, т.е. множество чисел в табличной модели получено до процесса моделирования и приведения матрицы чисел к математической форме. Именно в этом смысле следует понимать регрессионный анализ, то есть процесс проникновения во взаимосвязи прошлых данных. При этом термин «эвристический» подчеркивает необходимость максимально полного извлечения из прошлой информации полезных взаимосвязей, то есть функционального каркаса числовых данных (наполнители каркаса) в глубокой ретроспективе.

Статистическое моделирование - это процесс разработки моделей, которые отображают статистические закономерности описываемого объекта, явления (тенденции развития, взаимосвязи, степень воздействия и т.д.). Общей специфической чертой этих моделей (в отличии от детерминированных) является учет случайных возмущений (отклонений).

Из этого определения видно, что метод эвристического регрессионного анализа (МЭРА) является только одним из видов инструментов, позволяющих получить статистические модели. Для многих прикладных наук МЭРА - это существенно значимый инструмент, так как накопленные множества табличных матриц необходимо исследовать регрессивно, проникая в сущности прошлых упорядочений числовых данных и экстраполируя полученные знания и числовые временные и структурные ряды на будущее. Именно в этом заключается коренной гносеологический смысл методов регрессионного анализа, причем МЭРА позволяет во многих случаях отказаться от этапов факторного, корреляционного и дисперсионного анализов (зачастую в сформированных в прошлом матрицах данных описаний этих этапов просто не существует).

Методика МЭРА является инвариантной к различным отраслям науки, техники, экономики, экологии и биологии. Она также не зависит от обоснованности выбора исходной конструкции математической модели (аналитической с эмпирическими коэффициентами, полностью регрессионной, смешанного типа и пр.). Главное здесь заключается в идентификации принятой модели со статистическими данными и вычисление значений параметров модели, а также значений показателей верификации готовой модели.

Для статистического моделирования выделяются следующие принципы организации методики МЭРА: 1) идентификация - это процесс деятельности исследователя при сравнении реальных или мысленных объектов друг с другом; 2) чем больше эвристик в ходе идентификации, тем лучше и качественнее продукция идентификации - модель.

Математическая модель как бы «созревает» из исходной формы в конечную конструкцию с численными параметрами. Адекватность определяет соответствие реальных процессов с результатами, полученными при расчетах на модели. Здесь проявляется влияние сдвига времени, так как за период расчетов реальный процесс может «уйти» из того состояния, в котором он был в ходе моделирования.

Чтобы применять на практике статистические модели, приходится признать, что реальный процесс за время моделирования и применения готовой модели не выходит за рамки принятой концепции, то есть численно он является только стационарным и случайным (случайность однако мы понимаем как непознанную закономерность, а не хаос) процессом. Причем в общем смысле эта стационарность может учитывать также небольшие равномерно меняющиеся тенденции увеличения или снижения изучаемого случайного процесса (долговременные ламинарные тренды). Тогда МЭРА действительно становится инструментом, позволяющим проникать в прошлое конкретных числовых матриц.

Еще раз напомним, что готовая к употреблению, то есть полученная после моделирования аппроксимацией (бездумно принятая исходная форма) или идентификацией (сознательно сконструированная форма), математическая модель понимается как формальная машина, преобразующая исходный массив информации (очевидно, что этот массив является однородным по содержанию) в выходные результаты. Если выход результатов реального объекта и математической модели происходит синхронно, то говорят о сопоставлении в реальном режиме времени. Через определенные промежутки времени необходимо проводить такие сопоставления, корректирующие структуру модели или режим управления самим объектом изучения и измерения.

Применение моделей выдвигает проблему опасности сдвига смысла и исходного понимания, которое может меняться в ходе учета данных и затем моделирования. Это особенно характерно для экономики природопользования с долговременными природными зависимостями и кратковременными людскими интересами. Причем модель может постепенно так усложниться, что сами разработчики концепций, особенно это касается политиков, экономистов и плановиков, со временем будут терять черты исходной концептуальной модели в поведении математической модели.

Математик начинает формировать на основе анализа результатов расчетов свои «математические образы», то есть формальная машина из-за ошибок и несоответствия готовой модели реальности будет сдвигать целевую направленность математика к манипуляциям внутри самой модели. Постепенно, даже наиболее современные математические модели, например, социально-экономического анализа, сдвигают концептуальное понимание эконометрии в эконометрике так сильно, что конкретному экономисту становится неясным даже профессиональный смысл выходных результатов модели. Вот почему эвристика нужна постоянно: как в ходе моделирования, так и в ходе применения и корректировки итерациями готовой статистической модели. Эвристика постоянно позволяет адаптировать модель во времени к изменениям реально изучаемого процесса. Это очень важно при использовании методики МЭРА и всей методологии эвристической и структурно-параметрической идентификации.

Как и в случае изучения процесса функционирования системы «человек-машина» исследователь должен чувствовать «норов» поведения математической модели, что вполне обеспечивается с использованием современных быстродействующих ПЭВМ. Однако различные рассогласования модели с действительностью должны учитываться не только количественно (с помощью ПЭВМ), но и качественно, то есть содержательно человеком. Исследователь должен быть эвристически активным. Вот что отмечал по этому поводу академик Г.И. Марчук: «Модели сами по себе не дают окончательного решения, но с их помощью перебирая варианты исходных данных, можно понимать тенденции изменений и относительную значимость того функционала, который является основным в рассуждениях. Эти модели и результаты их исследований дают богатый материал для широких обобщений и выводов» [5].

При этом, в соответствии с принципом цикличности, статистическое моделирование методом МЭРА в своей основе вполне реализует знаменитое изречение М.В. Ломоносова: "Из наблюдений устанавливать теорию, через теорию исправлять наблюдения".

Статья опубликована при поддержке гранта 3.2.3/4603 МОН РФ

СПИСОК ЛИТЕРАТУРЫ:

  1. Мазуркин, П.М. Идентификация функционирования природохозяйственных систем / П.М. Мазуркин; Марийск. политех. ин-т. - М., 1989. - 335 с. - Деп. в ВНИПИЭИлеспром, №2536-лб89.
  2. Мазуркин, П.М. Эвристический регрессионный анализ (постановка проблемы) /
    П.М. Мазуркин; Марийск. политех. ин-т. - М., 1989. - 56 с. - Деп. в ВНИПИЭИлеспром, №2437-лб89.
  3. Мазуркин, П.М. Эвристический регрессионный анализ природохозяйственных явлений и процессов / П.М. Мазуркин; Марийск. политех. ин-т. - М., 1989. - 316 с. - Деп. в ВНИПИЭИлеспром, №2554-лб89.
  4. Мазуркин, П.М. Биотехническое проектирование (справочно-методическое пособие) / П.М. Мазуркин. - Йошкар-Ола: МарПИ, 1994. - 348 с.
  5. Мазуркин, П.М. Статистическое моделирование. Эвристико-математический подход / П.М. Мазуркин. - Научное издание. - Йошкар-Ола: МарГТУ, 2001. - 100 с.
  6. Сабанцев, Ю.Н. Статистическое моделирование лесоэкономических данных / Ю.Н. Сабанцев, П.М. Мазуркин. - Научное издание. - Йошкар-Ола: МарГТУ, 2001. - 390 с.
  7. Мазуркин, П.М. Закономерности устойчивого развития / П.М. Мпзуркин. - Научное издание. - Йошкар-Ола: МарГТУ, 2002. - 302 с.
  8. Мазуркин, П.М. Геоэкология: Закономерности современного естествознания: Научное изд. / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2006. - 336 с.
  9. Мазуркин, П.М. Математическое моделирование. Идентификация однофакторных статистических закономерностей: Учеб. пособие / П.М. Мазуркин, А.С. Филонов. - Йошкар-Ола: МарГТУ, 2006. - 326 с.
  10. Мазуркин, П.М. Статистическая социология: Учебное пособие / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2005. - 182 с.
  11. Мазуркин, П.М. Статистическая экология: Учебное пособие / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2004. - 308 с.
  12. Мазуркин, П.М. Статистическая эконометрика: Учебное пособие / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2006. - 376 с.
  13. Мазуркин, П.М. Закономерности распределения земельного фонда (на примере Республики Марий Эл): Научное издание / П.М. Мазуркин, А.Н. Фадеев. - Йошкар-Ола: МарГТУ, 2006. - 127 с.
  14. Мазуркин, П.М. Распределение индекса уровня жизни (по субъектам Российской Федерации): Научное изд. / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2006. - 56 с.
  15. Мазуркин, П.М. Статистическая модель периодической системы химических элементов Д.И. Менделеева: Научное изд. / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2006. - 152 с.
  16. 16. Солдатова, В.А. Динамика твердых отходов: Научное издание / В.А. Солдатова, П.М. Мазуркин. Под ред. проф. П.М. Мазуркина. - Чебоксары: МАДИ (ГТУ), Волжский филиал, 2006. - 257 с.
  17. Иванов, А.А. Экологическая оценка водосборов малых рек (на примере Республики Марий Эл): Научное издание / А.А. Иванов,
    П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2007. - 108 с.
  18. Мазуркин П.М. Лесоаграрная Россия и мировая динамика лесопользования: Научное издание / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2007. - 334 с.
  19. Мазуркин, П.М. Лесная аренда и рациональное лесопользование: Научное издание / П.М. Мазуркин. - Йошкар-Ола: МарГТУ, 2007. - 524 с.
  20. Арзамасцев, А.Д. Факторный анализ сельскохозяйственного производства: Научн. издание / А.Д. Арзамасцев, П.М. Мазуркин,
    Н.В. Максимец. - Йошкар-Ола: МарГТУ, 2009. - 388 с.