Eksperimentinė statistika
Palydoviniai vaizdai
tt
Žemės dangos atpažinimas iš palydovinių vaizdų
Metodologija
Tikslūs ir aktualūs žemės naudojimo ir žemės dangos žemėlapiai yra svarbūs įvairiose srityse, pavyzdžiui, atliekant miestų ir regionų planavimą, nelaimių ir pavojų stebėseną, gamtinių išteklių ir aplinkos valdymą. Vis labiau ryškėjant gyventojų, išteklių ir aplinkos problemoms, tikslus ir plataus masto žemės naudojimo ir žemės dangos klasifikavimo metodas, pagrįstas nuotolinio stebėjimo duomenimis, gali padėti sprendžiant daugelį svarbių didelio masto problemų.
Užduočiai atlikti pasirinkome pagal „CORINE Land Cover“ programą parengtą giliojo mokymosi modelį, kuriame pateikiama 2018 m. žemės dangos ir (arba) žemės naudojimo būklė, jį patikslinome, naudodami palydovines Sentinel-2 Lietuvos teritorijos nuotraukas.
Darbas buvo atliktas naudojant ArcGIS Pro programinę įrangą ir Python programavimo kalbą.
Duomenys ir jų apdorojimas
Atliekant užduotį buvo naudojamos Lietuvos teritorijos palydovinės nuotraukos, sudarytos iš viso Sentinel-2 juostų spektro, kurį sudaro 13 spektrinių juostų (nuo 10 iki 60 metrų dydžio pikselių). Iš jų mėlynojo (B2), žaliojo (B3), raudonojo (B4) ir artimųjų infraraudonųjų spindulių (B8) kanalų skiriamoji geba yra 10 metrų; augmenijos raudonojo krašto (B5), artimųjų infraraudonųjų spindulių NIR (B6, B7 ir B8A) ir trumpųjų bangų infraraudonųjų spindulių SWIR (B11 ir B12) rezoliucija yra 20 metrų. Galiausiai pakrantės aerozolio (B1) ir plunksninių debesų juostos (B10) pikselių dydis yra 60 metrų. Palydovinių nuotraukų lapai, sudaryti iš minėtų spektrinių juostų, buvo atrinkti mažinant lapo debesų dangą ir išskiriant pavasario–vasaros laikotarpius. Toliau šie lapai buvo sukarpyti į 512x512 pikselių sublapius ir kiekvienos juostos vertės normalizuotos į intervalą [0,1], kad vienodai išryškėtų signalo dispersija. Iš viso buvo surinktos 578 nuotraukos ir jose pažymėta daugiau nei 40 000 unikalių bruožų, atitinkančių CORINE klasifikaciją.
Teritorijų bruožų ženklinimas
Atliekant nuotolinius tyrimus naudojant giliojo mokymosi algoritmus, dažnai labai svarbus yra mokomųjų duomenų rinkinio apibrėžimas ir įsigijimas. Dažniausiai šie veiksmai atliekami rankiniu būdu – kiekvieną klasę atitinkančios teritorijos yra pažymėtos ir pateikiamos neuroninio tinklo mokymui. Šiame darbe minėtai problemai išspręsti buvo panaudotas Lietuvos georeferencinio pagrindo kadastras (toliau – GRPK) – tai valstybės kadastras, kuriame registruojami stabilūs žemės paviršiaus gamtiniai ir antropogeniniai objektai. Šis kadastras buvo sulygintas su CORINE žemės dangos klasifikacijos klasėmis, kaip pavaizduota 2 paveikslėlyje, ir sukurtas mokomųjų duomenų rinkinys giliojo mokymosi modeliui. Kadangi kiekviena klasė turi nevienodą kiekį pavyzdžių, taip pat buvo atlikta duomenų augmentacija šiom klasėm sulyginti – tai plačiai žinomas būdas pagerinti modelio klasifikacijos tikslumą.
1 pav. Palydovinės nuotraukos pavertimas į GRPK klases
CORINE klasifikacijos modelio patobulinimas, pritaikant Lietuvai
Konvoliucinis neuroninis tinklas (CNN) yra plačiausiai naudojamas giliojo mokymosi neuroninis tinklas vaizdams apdoroti. CNN yra neuroninių tinklų kategorija, kuri pasirodė esanti labai veiksminga tokiose srityse kaip vaizdų atpažinimas, vaizdų segmentavimas, klasifikavimas, kompiuterinė vizija ir natūralios kalbos apdorojimas. Naudojantis sukurtais mokomaisiais duomenimis, bazinis CORINE klasifikacijos modelis, sukurtas CNN pagrindu, buvo patobulintas pritaikant Lietuvos žemės dangai atpažinti. Vykstant modelio treniravimui buvo pasiektas vidutinis 88 % tikslumas atpažįstant skirtingas klases.
2 pav. GRPK ir CORINE klasifikacijos atitikmenys