Экология, гидрология, цифровизация, цифровые двойники и азбучные истины методологии моделирования

В.И. Данилов-Данильян[1]

 

Из государственных увлечений сегодня в нашей стране доминируют два – цифровизация и экология. Цифровизация сменила фаворита десятилетней давности – нанотехнологии. Сколько шума было в конце нулевых годов по поводу нанотехнологий! СМИ только о том и говорили, что чудеса нанотехники решат все наши проблемы. Естественно, не решили. Никто из специалистов и не сомневался в таком исходе. А что соответствующее направление науки? Да как развивалось, так и развивается, хотя, конечно, не шум в СМИ, а бюджетные вливания ему помогли.

Цифровизация и нанотехнологии – средства. Чрезмерное увлечение средствами всегда отвлекает от целей. Об этом важном свойстве увлечений нельзя забывать, когда мы пытаемся понять, чем на самом деле заняты СМИ. Но для серьёзной науки эти занятия чужды, как никакие другие. А вот экология – это не средство, а цель. Естественно, не экология как наука, а именуемая у нас экологией нормализация состояния окружающей среды в стране (и в мире). Через десять лет (и даже раньше) о цифровизации уже не будут говорить каждый день и каждый час, перестанут подогревать интерес к распространению информационных технологий во всех сферах человеческой деятельности – процессу, который длится три четверти столетия. Но экология останется в центре общественного внимания и государственной политики на века, а попытки не замечать её, столь характерные для периода с 2000 по 2016 год нашей истории, слишком дорого обходятся. И с каждым годом будут обходиться всё дороже.

Новое, как очень часто случается, – это хорошо забытое старое. Нечто похожее на современную цифровизацию (хотя, конечно, масштабы были не те) у нас происходило после того, как партия и правительство отменили приговор кибернетике как «буржуазной лженауке», в конце 1950-х – начале 1960-х годов (первая советская книга о кибернетике [1] вышла в свет в 1958 году). Родилась наивная вера в то, что кибернетизация вылечит больную советскую экономику. Сколько раз в те годы приходилось слышать заявления в таком роде: «Создайте ЭВМ (так назывались тогда компьютеры) со скоростью миллиард операций в секунду, и мы рассчитаем оптимальный план для экономики СССР». Конечно, такие обещания не публиковались, но из подтекста они высвечивают, например, в [2]. Отсчёт скорости современных суперкомпьютеров начинается с десяти триллионов операций в секунду (точнее – флопсов), но уже никто не провозглашает, что может составить на таком компьютере план для СССР, РФ или хотя бы Коста-Рики. И дело совсем не в скорости или объёме памяти компьютера, а в возможности формализации процессов, которыми собираются управлять. А эта возможность зависит от двух факторов: характера самих процессов и нашего пониманиях этого характера. К сожалению, характер невероятно сложен, а наше понимание, честно говоря, примитивно.

Волна цифровизации накрывает сейчас все направления государственной деятельности, и есть опасность, что среди тех задач, которые при этом будут пытаться решать, окажется немало мнимых, ненужных, неграмотно поставленных. Новые ошибки – очень часто повторение хорошо забытых или непонятых старых ошибок. По-другому это называется «наступать на одни и те же грабли». Надо выяснить, какие «грабли» лежат на пути эколого-гидрологических исследований, необходимых для разработки и реализации мер по оздоровлению наших рек, по нормализации экологической обстановки в их бассейнах, по рационализации водопользования.

Представляется, что главная опасность связана с непониманием сущности метода моделирования (и, следовательно, компьютерного моделирования). Сейчас вошёл в моду слоган «цифровой двойник». Вот как определяет это понятие Википедия: «Цифровой двойник (англ. Digital Twin) – цифровая копия физического объекта или процесса, помогающая оптимизировать эффективность бизнеса. Концепция “цифрового двойника”… призвана помочь предприятиям быстрее обнаруживать физические проблемы, точнее предсказывать их результаты и производить более качественные продукты». Цитирование Википедии – вынужденное, так как ни в книгах, ни в учебниках, ни, тем более, в энциклопедиях этот термин у нас пока не встречается. Приведённое описание интересующего нас понятия признать полноценным определением вряд ли возможно, поскольку неясно, что такое «цифровая копия». «Копия» нисколько не лучше «двойника», не подводит определяемое под более обширный, общий класс объектов и не выделяет его какими-либо специфическими признаками. Где сели, там и слезли.

Но в этом описании есть два правильно отмеченных важных момента: цель построения цифрового двойника – «оптимизировать эффективность бизнеса» (а вовсе не содействовать научным исследованиям и, вообще, обогащению наших знаний), класс решаемых проблем – «физические», а точнее, как следует из приведённой цитаты и, особенно, из дальнейшего текста в Википедии, – технические. На самом деле ограничение сферы применения методологии техническими проблемами означает, что цифровые двойники строятся для технических систем. Правомерно ли распространение методологии на нетехнические системы – природные, социальные, экономические? Ответ полностью зависит от того, что всё же понимается под «цифровым двойником».

В теории моделирования сложных систем всегда подчёркивается, что говорить о модели объекта вообще – некорректно. Правомерно говорить о модели объекта только применительно к конкретной цели, которую относительно этого объекта хочет достичь исследователь, прогнозист, плановик, управленец и пр. (Методологические основы моделирования сложных систем достаточно подробно освещаются, например, в [3]). Для многих задач небесной механики планету, в том числе Землю, достаточно рассматривать как материальную точку, модель (описание) которой сводится к девяти числам: момент времени, масса, величина скорости, три координаты точки и три координаты направления её движения. Однако для целей климатологии такая модель планеты совершенно неадекватна. Других научных дисциплин, интересующихся планетой, и упоминать не будем. Таких моделей, которые адекватны всем интересующим нас целям, для сложных систем построить нельзя. Это свойство сложных систем некоторые методологи даже принимают за определение сложной системы. А из всех материальных систем (объектов) «несложными» являются только технические (но, конечно, не все, к АЭС, например, это не относится). С этих позиций к определению из Википедии претензий нет: в нём сказано, что цифровые двойники помогают «оптимизировать эффективность бизнеса». Конечно, такие слова нельзя считать чёткой постановкой цели, но они, во всяком случае, характеризуют некоторый класс целей, можно сказать, предназначение цифровых двойников. Не имея внятного определения, попробуем понять, для каких объектов и с какими целями строятся конструкты, которым присваивается такое название.

Как представляется, большинство цифровых двойников – это базы данных (БД) нового поколения, с методологической точки зрения принципиально не отличающегося от предыдущего. Возросли мощности компьютеров, и появились возможности значительно увеличить параметры баз данных. Но принципы построения систем управления БД (СУБД) существенно не изменились: примерно те же, что и раньше, иерархические структуры, классификации, поисковые алгоритмы, способы пополнения и обновления информации в режиме онлайн и т.д. Это относится к БД, используемым во всех областях, в том числе и в научных исследованиях.

Не слишком трудно (были бы деньги) устроить БД о персонале в огромной фирме с сотней тысяч работников, где всякий из них будет подробно описан (десятки типов сведений), куда будет заноситься информация о результатах работы за каждый день через датчики, оборудованные на любом рабочем месте (автоматические, подсоединённые к оборудованию), либо из персональных компьютеров, на которых соответствующая информация набирается исполнителем вручную, и т.д. и т.п. Такая БД не будет ни моделью фирмы, ни моделью коллектива работников фирмы, хотя она очень полезна для отдела кадров, бухгалтерии и дирекции. Стоит ли называть её цифровым двойником коллектива?

Нетрудно устроить и БД, на которой будет информация обо всех деревьях лесопарка с несколькими сотнями тысяч деревьев. Если имеются надлежащим образом оборудованные дроны и системы обработки получаемых с них снимков, то для каждого дерева можно определить географические координаты (с точностью до дециметров) и его биологический вид, а также оценить размеры кроны (точнее, её проекции на горизонтальную плоскость). Можно добавить информацию, полученную контактным способом: предполагаемый возраст каждого дерева, диаметр его ствола на заданной высоте от поверхности и т.п. Такая БД может помочь не в «оптимизации эффективности бизнеса», а в достижении воспитательных, образовательных, эколого-пропагандистских целей. Но ни какой мере она не является моделью экосистемы лесопарка, поэтому называть БД цифровым двойником лесопарка – примерно тоже, что сказать о цифровой фотографии, будто она служит цифровым двойником человека, на ней изображённого.

Но применительно к технологическим системам (автомобилям, дронам, телевизорам, генераторам электрического тока, прокатным станам, установкам термического крекинга и т.п.) в слова цифровой двойник вкладывается совсем другой смысл, нежели БД. Цифровой двойник этих систем фактически представляет собой компьютерную имитационную модель, предназначенную для ответа на вопрос, как будет работать (функционировать) объект при тех или иных внешних условиях, управляющих воздействиях, выходе из строя тех или иных его элементов и т.п. В такой модели описаны не только все элементы системы (со всеми их возможными состояниями), но и все связи между ними, все реакции элементов на воздействия на них (по бихевиористской системе «стимул – реакция») и т.д. Естественно, имитируется поведение системы не в любых мыслимых обстоятельствах; класс рассматриваемых (возможных, допустимых) ситуаций априори ограничен и чётко описан, он включает все штатные режимы и ситуации и самые существенные, наиболее вероятные отклонения от них. Представляется, что называть цифровым двойником объекта подобную имитационную модель вполне корректно.

Возможно ли построить подобные цифровые модели для нетехнических систем – биологических, экологических, гидрологических, социальных, экономических? На наш взгляд, для корректности использования слова двойник необходимо, как минимум, чтобы в нём индивидуально были описаны все элементы системы и все необходимые для её функционирования связи между ними хотя бы при нормальных условиях. Выполнение уже этого требования представляется крайне маловероятным хотя бы в силу чрезвычайной многочисленности элементов и связей между  ними в таких системах. Более того, многие элементы нам вовсе неизвестны. Так, биологи спорят о том, какой процент биологических видов остаётся неизвестным науке, а ведь все такие организмы – элементы интересующих нас экосистем, выполняющие свою экологическую работу. Кстати, для примера напомним, что в 1 см3 почвы имеется до 1 млн живых организмов. Если же, как и делается в науке, не рассматривать всё множество индивидуальных элементов, а хотя бы некоторые из них объединить в агрегаты, то получится не двойник, а модель – образ объекта, упрощённый в соответствии с целью моделирования и более удобный для изучения, чем сам объект (или его копия, двойник, пусть даже и цифровой).

Далее, если в технических системах реакции на воздействия и само возникновение воздействий описываются детерминистски или как случайные величины с известными статистическими характеристиками, то для нетехнических систем характерно наличие неопределённостей, не поддающихся статистическому описанию. И дело не только в недостаточности наших знаний, но сплошь и рядом в самой природе явлений. Никто не знает, когда распадётся конкретный атом радиоактивного элемента. Если таких атомов очень много, можно оценить время, за которое распадётся половина этих атомов (оно называется периодом полураспада). Похожие с точки зрения количественного оценивания ситуации типичны для нетехнических систем. Однако, в отличие от физики, в той же гидрологии (а также экологии, биологии, социологии, экономике и пр.) постоянно приходится рассматривать не только статистические ансамбли, но и отдельные «атомы». Но и ансамбли часто не удовлетворяют аксиоматикам теории вероятностей и не могут рассматриваться как генеральные совокупности.

Специалистам по цифровизации, далёким от гидрологии, но заинтересовавшимся проблемами охраны и восстановления водных объектов, кажется, что стоит только разместить в реке и на территории её бассейна достаточное количество разнообразных датчиков и создать станцию приёма непрерывно поступающей от них информации с соответствующими хардвером и софтвером, и цифровой двойник реки будет готов, в компьютере потечёт «цифровая река». Увы, это далеко не так. В лучшем случае таким путём можно соорудить в этом хардвере цифровой двойник мониторинговой системы, только зачем он нужен? Для построения имитирующего цифрового двойника (а не БД, «фотографирующей», пусть даже непрерывно, свой объект и запоминающей большое количество «фотографий») необходимо знать свойства всех «атомов» и/или их ансамблей, закономерности их взаимодействий, их реакций на всевозможные внешние воздействия и т.п. В конкретных случаях эти закономерности надо калибровать ad hoc и т.д. Вполне адекватное представление об этих проблемах гидрологии и смежных дисциплин можно получить из [4].

Но дело не только в отмеченных (чрезвычайных!) трудностях и множестве других, в силу необходимости оставленных здесь за кадром. Нужен ли имитирующий цифровой двойник реки или её бассейна, озера или водохранилища и других, самых разнообразных, сложных нетехнических систем? Обо всех мыслимых системах говорить не будем, а относительно водных объектов представляется, что не нужен. Отнюдь не устарел обычный, классический подход. Если мы хотим что-то изменить в реальности, для этого должны быть причины, побуждающие поставить конкретные практические цели. Пусть эти цели таковы, что их достижение предполагает использование компьютерных технологий. Достаточно ли построить БД или нужны более сильные средства? Если нужны, значит, надо заниматься моделированием. Модель (или система моделей), как уже отмечалось, должна быть моделью объекта не «вообще», а ориентированной на конкретную цель. Без такой ориентации даже при непомерных затратах денег, сил и времени толку не будет никакого.

Основная проблема, которую цифровизаторы собираются решать посредством «цифровых двойников», – оздоровление рек и их бассейнов. Для решения этой задачи прежде всего надо выяснить, известны ли основные источники загрязнения. Если они известны, то спланировать первые шаги не слишком трудно. В индустриально развитых районах таковыми чаще всего служат организованные стоки промышленных предприятий и городская канализация, на их долю приходится подчас львиная доля попадающей в реку грязи; в сельскохозяйственных районах может преобладать диффузное загрязнение – сток от неточечных источников, прежде всего с сельскохозяйственных полей (но также с территорий населённых пунктов, промплощадок, полигонов для хранения отходов, свалок и др.). Тонкий количественный анализ здесь очень непрост, особенно с диффузным загрязнением, причём прямые измерения (с помощью датчиков и пр.) непосредственно практически ничего не дают, получаемую с их помощью информацию вкупе с различными другими данными надо обрабатывать на сложных моделях, чтобы получить хотя бы приблизительные оценки. Но для всех этих разысканий цифровой двойник не требуется! Этот монстр цифровизации съест все те средства, которые можно было бы потратить на очистные сооружения для самых опасных источников загрязнения. И первый шаг для решения задач экологического оздоровления, как правило, состоит в выборе одного-двух мероприятий из не слишком большого множества претендентов. Конечно, для обоснования выбора нужны и расчёты, и модели, но не цифровой двойник. Не понадобится он и для дальнейших шагов.

Обычно первое же столкновение с реальностью охлаждает неумеренный пыл энтузиастов, с этой реальностью ещё не контактировавших. Они прикидывают, сколько денег, времени и сил надо для создания «цифрового двойника» какой-нибудь малой реки, т.е. с площадью бассейна менее 2000 км2. Оказывается, многовато будет! А потом узнают, что площадь Обь-Иртышского бассейна 2990 000 км2. Нужны ли комментарии? И нужны ли разговоры [5] о революционизирующей цифровизации Обь-Иртышского бассейна?

Для развития гидрологии и для практической деятельности по оздоровлению рек, рационализации водопользования, защиты от наводнений и т.д. нам многого не хватает. Прежде всего, финансовых средств. Этим вопросам уделялось явно недостаточное внимание и в СССР, и в 1990-е годы, когда страна переживала тяжелейший экономический кризис, и в 2000–2007 годы, отмеченные нефтедолларовым дождём и верой в то, что так будет всегда, а потому на всём прочем не стоит особенно заморачиваться, и в совсем недавнем прошлом с новыми кризисами. Не хватает кадров: в стране, занимающей второе место в мире по объёму возобновляемых водных ресурсов, выпускается за год ничтожное количество специалистов-гидрологов. Не хватает информации: сеть гидрологических наблюдений всё ещё не восстановлена до уровня конца 1980-х годов (по современным меркам, совершенно недостаточного). Не хватает внимания к этой проблематике: ни у политиков, ни у СМИ, ни у общественников, ни у населения. Хотя в последние два-три года в этом отношении можно отметить некоторый позитивный сдвиг. А шумиха вокруг цифровизации (подобное явление Клод Шеннон описал в отношении теории информации в статье «Бандвагон» [6, с. 667–668] ещё 1956 году) будет только отвлекать и средства, и кадры, и внимание от серьёзных дел.

 

Список литературы

1. Полетаев И.А. Сигнал. О некоторых понятиях кибернетики. М.: Советское радио, 1958. – 413 с.

2. Каценелинбойген А.И., Овсиенко Ю.В., Фаерман Е.Ю. Методологические вопросы оптимального планирования социалистической экономики. М.: ЦЭМИ АН СССР, 1966. – 246 с.

3. Экономико-математический энциклопедический словарь / Гл. ред. В.И. Данилов-Данильян. М.: Большая Российская энциклопедия; ИНФРА-М, 2003. – 688 с.

4. Избранные труды Института водных проблем РАН (1967–2017). В 2 т. – М.: Курс, 2017. – 636+718 с.

5. Девянин И. Реки: реальные и цифровые // Кузбасс. Ежедневная областная газета. 4 июля 2019 г.

6. Шеннон К. Работы по теории информации и кибернетике. М.: Иностранная литература, 1963. – 832 с.




[1] Статья написана в июле 2019 г., опубликована в книге: Научные проблемы оздоровления российских рек и пути их решения. Сборник научных трудов. – М.: Студия Ф1, 2019. – С. 497–502 – и представлена в качестве доклада на Всероссийской конференции с международным участием «Научные проблемы оздоровления российских рек и пути их решения», 8-14 сентября 2019г., г. Нижний Новгород. Представляется, что через полгода после конференции и публикации её трудов актуальность поднятых в статье вопросов нисколько не снизилась.



Дата публикации:20.03.2020

Другие материалы


Все материалы