"Палеарктика қырандары: зерттеу және қорғау" III Халықаралық ғылыми-практикалық конференциясы

ҚАУЫРСЫНДЫ ЖЫРТҚЫШТАР ЖӘНЕ ОЛАРДЫ ҚОРҒАУ. АРНАЙЫ ШЫҒАРЫЛЫМ 2. АННОТАЦИЯЛАР

ТҮРЛЕРДІҢ ТАРАЛУЫН, САНЫН ЖӘНЕ ТІРШІЛІККЕ ҚАБІЛЕТТІЛІГІН МОДЕЛЬДЕУ: ЖАҢА МҮМКІНДІКТЕР МЕН ӘДІСТЕР

Карякин И.В., Книжов К.И. (Жыртқыш қанатты құстарды зерттеу және қорғау жөніндегі ресейлік желі; «Сибэкоцентр» ЖШҚ, Новосибирск, Ресей)


Контакт:
Игорь Карякин ikar_research@mail.ru
Кирилл Книжов kirillknizhov@gmail.com
Ұсынылатын дәйексөз: Карякин И.В., Книжов К.И. Түрлердің таралуын, санын және тіршілікке қабілеттілігін модельдеу: жаңа мүмкіндіктер мен әдістер. – Пернатые хищники и их охрана. 2023. Спецвып. 2. С. 347–357. DOI: 10.19074/1814-8654-2023-2-347-357 URL: http://rrrcn.ru/ru/archives/35134


Ірі жыртқыш құстардың көптеген түрлері қазіргі уақытта сирек кездеседі, олардың көпшілігі жойылып кету қаупінде, сондықтан олардың таралуы, саны және тіршілікке қабілеттілігі туралы мәліметтер сақтау және қалпына келтіру шараларын жоспарлаудың, осы түрлердің популяцияларына қоршаған ортаның антропогендік трансформациясы және/немесе климаттың өзгеруі әсерін бағалаудың маңызды көрсеткіштері болып табылады.

Зерттелетін құстардың саны мен кеңістікте таралуы далалық зерттеулер кезінде анықталады. Шығару кезінде біз жеке бастар, жұптар, ұялар бірлігіне (мысалы, жұп/100 км2) ең жақын немесе барлық көршілер арасындағы қашытықты аламыз немесе математикалық мәндер ретінде ұсынылуы мүмкін (1–5 орта есеппен 3,5±1,1 км), және графикалық түрде (бақылау нүктелерін Делон триангуляциясына қосатын қарапайым сызықтардан және бақылау нүктелерінен салынған көпбұрыштар желісінен). Әрі қарай, санын бағалау үшін бұл деректерді экстраполяциялауға болатын ауданды түсіну қажет. Осыған байланысты көптеген зерттеушілерде мәселе туындайды – есептелетін түрдің мекендеу орны ауданын дұрыс бағаламау санын бағалаудың бұрмалануына әкеледі және санақ жұмыстарын ниверлирлейді. Есеп мәліметтерін экстраполяциялауға болатын ауданды қалай дұрыс анықтауға болады? Бұл сұрақтың жауабын қазіргі заманғы терминологияда – Түрлердің таралуын модельдеу (Species distribution modelling, SDM) экологиялық және кеңістіктік ақпараттың географиялық қабаттарын пайдалана отырып, ГИС-те модельдеу арқылы беруге болады.

Тіршілік ету ортасын немесе түрдің мекен ету орындарын модельдеу деп те аталатын SDM процесінде қоршаған орта деректері – температура, ылғалдылық, жел жүктемесі, жер бедері, өсімдіктер жамылғысы, топырақ және т.б. сияқты климаттық және кеңістіктік ауыспалылар – түрдің географиялық сілтеме нүктелері үшін анықталады (предикторлар немесе тәуелсіз ауыспалылар) және компьютерлік алгоритмдер мен математикалық әдістер арқылы түрдің географиялық кеңістікте және/ немесе уақытта таралуы болжанады.

SDM 6 кезеңде жүзеге асырылады: (1) идеяларды тұжырымдамалау, (2) деректерді дайындау (бар болу және жоқ нүктелері немесе фондық нүктелер), (3) әдісті таңдау (4) модельді сәйкестендіру, модельді бағалау және (6) тіршілік ету ортасының немесе таралу аймағының картасын құру.

1. Тұжырымдамалау. Бұл кезеңде біз зерттеудің негізгі мақсатын тұжырымдаймыз және түр және зерттеу туралы білімімізге сүйене отырып, модельдеу процесінің үлгісін туралы шешім қабылдаймыз. Бастапқы кезеңдегі маңызды сәт – түр мен қоршаған орта туралы мәліметтерді таңдау. Біз тек өз деректерімізді пайдалануды немесе басқа қолжетімді деректерді пайдалану туралы шешім қабылдаймыз. Бұл үлгі дизайнына кейбір түзетулерді қажет етеді. Әрі қарай, біз SDM негізінде жатқан негізгі болжамдарды мысалы, түрдің қол жетімді қоршаған орта ауыспалыларымен тепе-теңдікте болу-болмауы, деректер қандай да бір жолмен бұрмалануы мүмкін бе (іріктеменің ауытқуы, кеңістіктік автокорреляция және т.б.) мәліметтерді жинау уақытына қатысты орта және т.б. тексеруіміз керек. Адекватты экологиялық және кеңістіктік ауыспалыларды таңдау, модельдеу алгоритмі және модель күрделілігі зерттеу мақсатына және зерттелетін түрлер мен зерттеу үшін таңдалған аумақтағы қоршаған орта арасындағы қарым-қатынасқа қатысты гипотезаға негізделуі керек.

2. Мәліметтерді дайындау. Бұл кезеңде біз түр (болу нүктелерін де, жоқ болу нүктелерін де) және қоршаған орта туралы нақты деректерді жинаймыз және өңдейміз. Тәуелді және тәуелсіз ауыспалылардың кеңістіктік және уақытша масштабтауындағы кез келген сәйкессіздіктерге деректерді дайындау кезінде ерекше назар аудару керек, яғни, түрлер мен қоршаған орта деректері немесе қоршаған орта деректері (кеңістіктік және климаттық айнымалылар) арасында үлкен кеңістіктік немесе уақыттық айырмашылық бар жағдайлар. Сондай-ақ, бар болу нүктелерінің географиялық байланысу сапасына және түрлерді сәйкестендіру сапасына ерекше назар аудару керек, әдетте, деректерді әуесқойлар жинаған жағдайда үлкен зардап шегеді. Мұндай жағдайларда біз деректерді түзету немесе оларды жою туралы шешім қабылдауымыз керек. Барлық SDM алгоритмдері түрлердің жоқтығы туралы ақпаратты талап етеді. Мұндай жағдайларда біз деректерді түзету немесе оларды жою туралы шешім қабылдауымыз керек. Барлық SDM алгоритмдері түрлердің жоқтығы туралы ақпаратты талап етеді. Егер мұндай ақпарат жоқ болса, ол фондық нүктелермен немесе псевдо-болмау деп аталатын деректермен ауыстырылады, бұл әрине модельдеу сапасына, әсіресе кең ауқымда теріс әсер етеді. Егер модельдеу жиналған деректердің толық көлемін пайдаланса және үлгіні өрісте одан әрі сынау жоспарлары болмаса, модельдерді оқыту және модельді сынау үшін түр деректерінің қалай бөлінетінін алдын ала қарастыру керек.

3. Әдіс таңдау. Бұл кезеңде біз модельдеу әдісін немесе ансамбльдік модельдерге біріктіру үшін бірнеше әдістерді таңдаймыз.
Егер модельдеудің бастапқы кезеңдерінде жұмыс үстеліндегі ГИС-ке біріктірілген қарапайым фактор немесе кластерлік талдаулар қолданылса, қазір алгоритмдер жиынтығы айтарлықтай кеңейді:

Сызықтық регрессияға негізделген әдістер:
- Жалпылама сызықтық модель (GLM) (Nelder, Wedderburn, 1972),
- Жалпыланған аддитивті модель (ГАМ) (Хасти, Тибширани, 1990);

Машиналық оқыту әдістері:
- MaxEnt (Soberson, Peterson, 2005; Phillips et al., 2006; Phillips, Dudik, 2008),бағдарламасында енгізілген максималды энтропия әдісі,
- Кездейсоқ орман (Random Forest) оқыту кезінде бірнеше шешім ағаштарын құру арқылы жұмыс істейтін жіктеу мен регрессияға арналған ансамбльдік оқыту әдісі (Breiman, 2001),
- Күшейтілген регрессия ағаштары (BRT),
- Өте дәл нейрондық желілер (CNN) (LeCun et al., 1989),
- Ережелер жинағын құрудың генетикалық алгоритмі (GARP) (Stockwell, 1999; Stockwell, Peters, 1999),
- Векторлық желілерді қолдайтын машиналық оқыту (Support Vector Machines, SVM) (Cortes, Vapnik, 1995; Vapnik et al., 1997)
- XGBoost (eXtreme Gradient Boosting, XGB) (Chen, Guestrin, 2016).

MaxEnt және Random Forest ArcGIS жүйесіне біріктірілген, R ортасында қолдау көрсетіледі және Google Earth Engine (GEE) пайдаланушылары үшін онлайн қолжетімді. Соңғы жылдары GEE SDM үшін ресурс ретінде кеңінен танымал бола бастауда (Crego et al., 2022).

4. Модельді сәйкестендіру. Бұл кезең SDM үшін маңызды болып табылады. Алдын ала модельдеу деректерін ала отырып, біз мультиколлинеарлық үлесті бағалаймыз және онымен қалай күресуге болатынын шешеміз, оны қайта оқытпай модельге қанша ауыспалыны енгізу керектігін анықтаймыз, кеңістіктік немесе уақытша автокорреляцияны бағалаймыз және онымен қалай күресуге болатынын шешеміз, үлгінің немесе бірнеше модельдің параметрлерін таңдап, қайсысы жақсы немесе орташа нәтижені пайдаланатынын таңдаймыз. Дәл осы кезеңде біз түрлердің болу нүктелері мен қоршаған ортаның ауыспалылары арасындағы таңдалған қатынастардың орындылығын коэффициенттерді салыстыру және графиктердегі сызылған қисықтарды визуалды тексеру арқылы тексереміз.

5. Үлгілік бағалау.  Бұл кезеңде біз тексеру немесе сынақ деректерінің жиынтығын пайдаланып соңғы үлгінің болжамдық тиімділігін бағалаймыз: AUC (ROC) (Fielding, Bell, 1997; Fawcett, 2006; Hosmer, Lemeshow, 2013), TSS (Liu et al., 2005; Allouche et al., 2006); R2 и Kappa (Brownlee, 2016; Zhang et al, 2021). Осы мақсат үшін әдетте қиылыстырып тексеру (кеңістіктік блоктар) қолданылады (Roberts et al., 2017; Valavi et al., 2019; Crego et al., 2022) Біз сондай-ақ қиылыса тексерілген болжамдар негізінде болжанған бинаризация үшін шекті мәндерді таңдаймыз.

6. Тіршілік ету ортасының немесе таралу аймағының картасын құру. Бұл SDM-нің соңғы кезеңі, оның барысында біз болжамдық модельді растрға түрлендіреміз және әрбір пиксель үшін зерттеу аймағында кездесетін түрлердің пайыздық ықтималдығы бар жіктелген кескінді аламыз. Біз соңғы диапазон картасына енгізетін пикселдер үшін түрлердің болу ықтималдығының шегін және тіршілік ету ортасының ауданын анықтау үшін осы пикселдердің айналасында салынған буфердің өлшемін анықтаймыз. Біз соңғы диапазон картасына енгізетін пикселдер үшін түрлердің болу ықтималдығының шегін және тіршілік ету ортасының ауданын анықтау үшін осы пикселдердің айналасында салынған буфердің өлшемін анықтаймыз. Буферді қолданудың орындылығы алынған растрдың масштабына байланысты, масштаб неғұрлым кіші болса, буфердің өзектілігі соғұрлым төмен болады. Буфер өлшемі әдетте орташа ең жақын көршілес қашықтықпен (MND) анықталады және модельдеу мақсаттары мен міндеттеріне байланысты MND-нің жартысы, толық немесе екі еселенген мөлшері болып табылады.

Әрқашан SDM-дегі негізгі болжамдарды сыни тұрғыдан бағалау керек және әртүрлі факторлармен байланысты ықтимал шектеулерді білу керек: түрді анықтау мүмкіндігі, біркелкі емес іріктеу, қоршаған ортаның ауыспалыларын таңдаудағы шектеулер, түрдің биологиясы оның биотопиялық және аумақтық қалауларындағы заңдылықтарды анықтау үшін зерттеудің кейбір аспектілерін білмеу және т.б. SDM түрдің қоршаған ортамен тепе-теңдікте екенін, біз түрдің болу нүктесін де, қоршаған орта деректерін де білеміз және мұқият таңдадық және түрдің таралу шегін анытайтын барлық негізгі факторларды енгіздік деп болжайды. Бұл аспектілер бірнеше себептерге байланысты тұраты емес екенін түсіну керек. Біріншіден, түрлер, әсіресе жыртқыштар, қоршаған ортаның өзгеруіне динамикалық жауап береді, сондықтан олар белгілі бір кеңістіктік және уақыттық динамикаларды көрсетеді және модельдеу кезінде дұрыс ескерілуі керек. Түрдің тіршілік ету ортасының өзгеруіне реакциясын анытайтын маңызды факторларға оның физиологиясы, демографиясы, таралу қабілеті, урбанизацияға төзімділік дәрежесі, қоршаған орта факторларының өзгеруіне бейімделу дәрежесі және түр аралық өзара әрекеттесу жатады. Осы факторлардың барлығы уақыт өте келе, соның ішінде осы жерде және қазір әрекет етеді және оларды елемеу модельдеу нәтижелерін айтарлықтай бұрмалауы мүмкін. Сондықтан, SDM үшін тамаша нұсқа өрістегі нәтижелерді тексеру және оларды реттеу болып табылады.

Өкінішке орай, орнитологтардың көпшілігі R және жұмыс үстелі ГИС-ті пайдалануда қиындықтарға тап болады, бұл олардың далалық зерттеулерінің нәтижелерін заманауи талаптарға сәйкес өңдеуге кедергі жасайды. Сирек кездесетін түрлермен жұмыс істеу кезінде модельдеуді тәжірибеде жақсырақ енгізу үшін біз ГИС және бағдарламалау тілдерін аз білетін, бірақ SDM алгоритмдері және санын бағалау, сирек түрлердің таралуы мен көптігі мен тіршілігін модельдеу туралы белгілі бір түсінігі бар құс мамандарына мәселелерді шешуге мүмкіндік беретін бағ- дарламалық өнімді жасадық. Бағдарламалық өнім түрлерді бақылауды қамтитын әртүрлі геодеректерді өңдеуге арналған; GEE растрларынан мәліметтер алуға; биотоптардың классификациялауға; популяциясын, тіршілікке қабілеттілігін т.б. бағалауға.

Өнімнің негізгі интерфейсі веб-интерфейс1 болып табылады, ол қызытыратын процесті таңдауға, қажетті деректерді енгізуге және өңдеу нәтижелерімен мұрағатқа сілтеме алуға мүмкіндік береді.

Геодеректер үшін (нүктелер, полигондар және т.б.) csv, shp, geojson файлдарын енгізуге, сонымен қатар картаны пайдаланып қолмен енгізуге болады. GEE растрларынан деректерді қосуды қажет ететін алгоритмдерді іске қосу үшін жерді қашытықтан зондтау (ЖҚЗ) қолжетімді өнімдерінің тізімінен таңдау өрісі беріледі: NASADEM (NASA JPL, 2020), MOD13A1.061 Terra Vegetation Indices 16-Day Global 500m (Didan, 2021), Geomorpho90m (Amatulli et al., 2020), Global Habitat Heterogeneity (Tuanmu, Jetz, 2015), Global Wind Atlas (Badger et al., 2021), World Clim (Fick, Hijmans, 2017), ERA5-Land Monthly Aggregated – ECMWF Climate Reanalysis (Muñoz Sabater, 2019), ESA WorldCover 10m v100 (Zanaga et al., 2021), Dynamic World V1 (Brown et al., 2022), (SR) Landsat 8 жіктелмеген спутниктік деректер, мысалы, (SR) Landsat 8 атмосфералық түзетілген беттік 2 шағылысу жинағы (көк, қызыл, жасыл, жақын инфрақызыл және қысқа толқынды инфрақызыл 1 жолағы 30 м кеңістіктік рұқсат) және L-диапазонды синтетикалық апертура массиві (SAR) антенналары бар HH және HV ALOS поляризация деректер жинағы, сондай-ақ GEE (normalizedDifference) функциясын пайдаланып Landsat 8 кескіндерінен NDVI және EVI есептеулері. Әртүрлі үшінші тарап кітапханаларының көмегімен алгоритмдерді іске қосу үшін деректер csv файлдарына сәйкес кітапханалар талап ететін пішімдерде енгізіледі.

Қазіргі кезеңде өнімге келесі модульдер кіреді:
1) Берілген нүктелер үшін GEE растрларынан мәліметтер алу (нәтиже GEE жиынына енгізілген растрлардан нүктелер үшін таңдалған деректері бар кесте);
2) GEE негізіндегі RF және MaxEnt жіктеуіштерін пайдалана отырып, берілген аумақ үшін жіктелген растрды және көріністің бар және жоқ нүктелерінің жиынын (жаттығу нүктелерін) алу (екеуі де белгілі бір қызығушылық аймағы үшін қызығушылық аймағының сәйкес GEE растрлық әдістерін қолдана отырып, классификацияланғанын алу үшін оқу нүктелерінің және GEE-ден таңдалған қашықтан зондтау өнімдерінің жиынтығы. Таңдалған үлгілерді кросс-валидациялауға және олардың болжамдық тиімділігін бағалауға болады);
3) Популяция санын үш түрлі әдіспен бағалау:
3.1) ұдайы желіде кездейсоқ нүктелерді генерациялау – түрдің болу нүктелері және зерттелген аумақтар бойынша деректер негізінде жалпы қызығушылық аймағы бойынша түрдің таралуын модельдейтін кездейсоқ нүктелерді түрлендіретін эвристикалық алгоритм;
3.2) Distance – әдісі, Distance Sampling (Thomas et al., 2010; Buckland et al., 2015; Miller et al., 2019) үлгісіне негізделген нүктелер мен аймақтар үшін қажетті ауыспалылары бар файлды кіріс ретінде қабылдайтын және нәтижесінде егжей-тегжейлі статистиканы шығаратын модельге негізделген әдіс;
3.3) түрдің таралу тығыздығының орташа өлшенген көрсеткішін есептеумен (Карякин, 2004) асимметриялық сенімділік интервалын есептеумен (Равкин, Челинцев, 1990) қарапайым аудандық есептеулер;
4) RMARK (Laake, 2013) кітапханасы негізінде ұялардың өміршеңдігін бағалау. Тіршілікке қабілеттілігін есептеу модулі қашықтан зондтау деректерінен әртүрлі айнымалы мәндерді есепке алатын және ұяның аман қалуы үшін айнымалы мәндердің маңыздылығын шығаратын RMARK кітапханасының nest әдісін пайдаланып ұяның аман қалу деректерін өңдеуді қамтиды.

Бағдарламалық өнім Ресейде қалаусыз деп танылған ұйымдардың серверлерінде орналастырылып, оған кіруге Роскомнадзор тыйым салғандытан, авторлар ресейлік ресурста клон жасау нұсқаларын қарастыруда.

Бұл жұмыс The Critical Ecosystem Partnership Fund (CEPF)қаржылық қолдауымен «Үнді-Палеарктикалық көші-қон ұшатын жолында жойылып бара жатқан қауырсынды жыртқыштарды сақтау» (“Endangered Raptors Conservation on the Indo-Palearctic Migration Flyway”) жобасы аясында жүзеге асырылады.


http://www.gis.altaiproject.org

http://www.cepf.net