Posted in

Pengambilan Sampel Klaster yang Terstratifikasi dan Seimbang Secara Spasial untuk Survei Lingkungan yang Hemat Biaya

Pengambilan Sampel Klaster yang Terstratifikasi dan Seimbang Secara Spasial untuk Survei Lingkungan yang Hemat Biaya
Pengambilan Sampel Klaster yang Terstratifikasi dan Seimbang Secara Spasial untuk Survei Lingkungan yang Hemat Biaya

ABSTRAK
Survei lingkungan berskala besar yang mengandalkan kerja lapangan intensif mahal, tetapi metodologi pengambilan sampel survei menawarkan beberapa opsi untuk meningkatkan efisiensi biaya. Misalnya, lokasi yang dipilih untuk penilaian lapangan dapat diatur dalam kelompok untuk mengurangi waktu yang dihabiskan untuk berpindah antarlokasi, dan data tambahan dapat digunakan untuk membuat stratifikasi wilayah survei dan mengambil sampel strata yang kurang penting dengan lebih sedikit kepadatan. Pengambilan sampel yang seimbang secara geografis dan tersebar dengan baik dapat menghasilkan peningkatan lebih lanjut karena variabel target survei lingkungan cenderung berkorelasi secara spasial. Kombinasi dari ide-ide ini diilustrasikan dan dievaluasi dalam konteks inventarisasi hutan nasional, dan metode alternatif pengambilan sampel yang seimbang secara spasial dibandingkan. Temuan utama adalah bahwa (i) baik metode pivotal lokal maupun desain stratifikasi acak-teselasi umum menjamin keteraturan spasial yang jelas lebih baik daripada pengambilan sampel sistematis ketika diterapkan pada wilayah terfragmentasi yang dihasilkan dari stratifikasi dan (ii) keduanya juga memastikan keseimbangan global yang lebih baik dalam pengambilan sampel yang tidak terstratifikasi. Dalam studi kasus kami, di mana stratifikasi dan alokasi sampel didasarkan pada data tambahan berkualitas tinggi, pengambilan sampel terstratifikasi jelas lebih efisien daripada yang tidak terstratifikasi untuk parameter target survei utama. Namun, hasil kami juga menggambarkan bahwa alokasi sampel yang sangat tidak proporsional dapat berbahaya dalam survei multiguna.

1 Pendahuluan
Pemantauan lingkungan sering kali bergantung pada survei sampel berdasarkan kerangka wilayah, di mana pengukuran lapangan dilakukan pada lokasi sampel (misalnya, dengan menggunakan plot sampel melingkar) yang dipilih dari wilayah survei (Gregoire dan Valentine 2007 ; Vallée et al. 2015 ; Prentius dan Grafström 2022 ). Untuk menghindari bias seleksi, lokasi yang dinilai di lapangan harus dipilih dengan beberapa desain pengambilan sampel probabilitas (Särndal et al. 2003 ). Sementara pengambilan sampel acak sederhana terkenal tidak efisien (misalnya, Fattorini et al. 2015 ), alternatif yang hemat biaya mencakup pengambilan sampel berstrata (Rennolls 1989 ; Roux et al. 2013 ), pengambilan sampel yang seimbang secara spasial (misalnya, Grafström, Schnell, et al. 2017 ), dan pengambilan sampel kluster (misalnya, Vallée et al. 2015 ).

Pengambilan sampel berstrata menjadi semakin menarik dengan pengembangan penginderaan jarak jauh beresolusi tinggi yang semakin presisi dan penentuan posisi yang akurat, yang memungkinkan konstruksi dan pemanfaatan peta tematik yang sangat informatif dari variabel tambahan yang mencakup wilayah survei (Nyyssönen et al. 1968 ; Rennolls 1989 ; Tomppo et al. 2014 ). Peta tersebut dapat digunakan untuk memastikan bahwa berbagai subwilayah (strata), yang digambarkan dari peta tambahan terwakili dalam sampel dalam proporsi yang sama seperti dalam populasi target atau untuk menginvestasikan upaya pengambilan sampel yang relatif lebih banyak pada strata yang lebih bervariasi (Neyman 1934 ). Bahkan dalam kasus sebelumnya, stratifikasi meningkatkan efisiensi, jika varians dalam strata dari variabel target survei kecil dibandingkan dengan perbedaan rata-rata strata mereka (Cochran 1977 , bagian 5.1).

Efisiensi pengambilan sampel yang seimbang secara spasial berasal dari hukum pertama geografi (Tobler 1970 ); proporsi variasi yang lebih besar dalam populasi target (wilayah survei) dapat ditangkap dalam sampel dengan menyebarkannya secara lebih teratur. Meskipun pengambilan sampel sistematis bisa dibilang merupakan metode yang paling umum untuk mencapai keseimbangan spasial (Mostafa dan Ahmad 2018 ), beberapa alternatif yang lebih fleksibel telah dikembangkan baru-baru ini (Stevens dan Olsen 2004 ; Grafström et al. 2012 ; Grafström dan Tillé 2013 ; Benedetti dan Piersimoni 2017 ; Chauvet dan Le Gleut 2021 ; Prentius 2023 ).

Pengambilan sampel klaster dapat dianggap sebagai kebalikan dari pengambilan sampel yang seimbang secara spasial: Kelompok lokasi yang berdekatan disertakan dalam sampel. Motivasinya adalah bahwa pengurangan biaya yang diperoleh terkadang dapat mengimbangi hilangnya efisiensi statistik yang disebabkan oleh peningkatan korelasi spasial dalam sampel (misalnya, Vallée et al. 2015 ). Misalnya, plot sampel Inventarisasi Hutan Nasional Finlandia (NFI)—seperti halnya banyak NFI lainnya (Tomppo et al. 2010 , tabel 2.3)—disusun dalam klaster sehingga semua plot dari satu klaster berada dalam jarak berjalan kaki dan pengukuran satu klaster seharusnya memerlukan waktu satu hari kerja (Tomppo et al. 2011 , bagian 2.1). Hal ini mengurangi waktu kerja lapangan per plot dan dengan demikian memungkinkan sampel yang lebih besar dengan biaya tertentu. Pengelompokan plot sampel juga dapat menguntungkan saat mensurvei populasi yang berkelompok (Prentius dan Grafström 2022 ), tetapi gagasan ini tidak akan dibahas di sini.

Räty dkk. ( 2020 ) membandingkan pengambilan sampel sistematis dan metode pivotal lokal (LPM; Grafström dkk. 2012 ) sebagai metode alternatif untuk menyebarkan sampel secara teratur di wilayah survei. Dalam studi kasus tersebut, kedua metode tersebut sama-sama efisien. Namun, tidak jelas apakah hasil ini berlaku saat mengambil sampel populasi yang terstratifikasi. Stratifikasi berdasarkan peta resolusi tinggi dapat menyebabkan strata pengambilan sampel yang sangat terfragmentasi, yang dapat mengurangi keseimbangan spasial sampel sistematis.

Desain pengambilan sampel alternatif untuk survei lingkungan dapat dibandingkan berdasarkan pengambilan sampel yang direplikasi dari populasi sintetis, yang nilai variabel target surveinya diketahui di semua unit populasi (misalnya, Kermorvant et al. 2020 ). Idealnya, unit populasi harus membentuk kisi titik padat yang mencakup wilayah survei. Nilai variabel target sering kali diperoleh dengan beberapa bentuk interpolasi spasial dari data survei sebelumnya dari wilayah yang sama. Seperti dicatat oleh Kermorvant et al. ( 2020 ), orang perlu menyadari risiko yang terkait dengan pendekatan ini. Secara khusus, permukaan spasial yang direkonstruksi dari variabel target cenderung lebih halus, yaitu, kurang bervariasi daripada permukaan sebenarnya. Hal ini dapat dengan mudah menyebabkan perkiraan yang lebih rendah dari ukuran sampel yang diperlukan, jika penentuannya murni didasarkan pada simulasi pengambilan sampel. Di sisi lain, perbandingan desain pengambilan sampel masih dapat diandalkan, jika variasi spasial sebenarnya cukup ditampilkan dengan baik dalam populasi sintetis. Validasi independen penting dilakukan jika kita juga perlu mengevaluasi efisiensi absolut—selain efisiensi relatif—dari survei yang direncanakan.

Tujuan utama dari studi ini adalah untuk menilai kinerja pengambilan sampel sistematis terhadap desain yang lebih baru yang seimbang secara spasial dalam konteks survei lingkungan yang terstratifikasi. Karena fokus kami adalah pada pengungkapan potensi masalah dari pengambilan sampel sistematis yang umum diterapkan daripada pada perbandingan yang mendalam, kami hanya mempertimbangkan dua metode alternatif yang mudah diakses, LPM (Grafström et al. 2012 ) dan desain stratifikasi teselasi acak umum (GRTS; Stevens dan Olsen 2004 ), serta pengambilan sampel acak sederhana sebagai dasar. Sebuah studi simulasi pengambilan sampel dilakukan, yang bertujuan pada desain NFI yang efisien untuk Finlandia paling utara, dan varians pengambilan sampel yang diantisipasi dibandingkan dengan yang diperkirakan dari data NFI aktual.

Untuk memperoleh pemahaman yang lebih mendalam tentang alasan di balik kinerja yang berbeda dari desain yang seimbang secara spasial, aspek keseimbangan spasial lokal dan global dipelajari dari sampel spesifik strata dan sampel yang tidak terstratifikasi. Tujuan lain dari makalah ini adalah untuk menyajikan desain pengambilan sampel NFI yang dikembangkan untuk wilayah studi yang menantang kepada pembaca yang lebih luas. Pengambilan sampel klaster yang terstratifikasi dan seimbang secara spasial telah ditemukan hemat biaya dalam mensurvei populasi target yang terfragmentasi dan dapat berfungsi sebagai kerangka kerja untuk merencanakan survei lain di lingkungan yang serupa.

2 Bahan dan Metode
2.1 Inventarisasi Hutan Nasional (NFI) Finlandia
Di Finlandia, seperti juga di banyak negara lain, NFI adalah penyedia utama informasi nasional tentang status dan perkembangan sumber daya hutan dan beberapa aspek lain dari lingkungan hutan (Tomppo et al. 2010 ). Sasaran utama NFI Finlandia mencakup penggunaan lahan dan perubahannya, volume stok tumbuh (batang pohon hidup), dan pertambahannya (Korhonen et al. 2024 ). Pohon diukur di “lahan berhutan” (Tabel 1 ), yang mencakup 75% dari luas daratan Finlandia (Korhonen et al. 2024 ) termasuk semua lokasi yang memenuhi definisi hutan FAO (FAO 2023 ). Stok tumbuh yang dinilai dalam NFI Finlandia mencakup semua pohon hidup yang tumbuh di lahan berhutan dan melebihi batas tinggi minimum 1,35 m. Dalam kampanye yang baru saja selesai, NFI ke-13 Finlandia (NFI13; 2019–2023), 62.266 plot sampel lapangan di lahan dinilai dan hampir satu juta pohon diukur (Korhonen et al. 2024 ). Parameter target survei yang dipertimbangkan dalam studi ini adalah luas lahan hutan (singkatnya, “area hutan”) dan total volume stok yang tumbuh di lahan hutan (“total volume”).

TABEL 1. Kelas penggunaan lahan yang digunakan dalam NFI Finlandia (Korhonen et al.  2024 ) dan hubungannya dengan istilah yang digunakan dalam studi ini. Dalam kerja lapangan NFI, kelas penggunaan lahan dari semua plot contoh lapangan ditentukan di lokasi, kecuali penggunaan lahan selain kehutanan dapat ditentukan tanpa keraguan dari peta dasar. Dalam MS-NFI, lahan kehutanan dipisahkan dari kelas lain menggunakan data peta digital, dan klasifikasi dalam lahan kehutanan didasarkan pada kombinasi data lapangan NFI dan citra satelit (Lampiran  A ).
Kelas penggunaan lahan NFI Studi ini
Lahan hutan produktif Lahan kehutanan Lahan hutan
Lahan hutan yang kurang produktif
Lahan kehutanan yang tidak produktif Lahan tak berhutan
Lahan kehutanan lainnya
Lahan pertanian Selain lahan kehutanan
Lahan terbangun
Jalan Raya
Saluran pasokan listrik
Perairan pedalaman Bukan tanah
Laut

2.2 Wilayah Studi
Studi ini awalnya dimotivasi oleh kebutuhan untuk merancang pengambilan sampel NFI13 di bagian paling utara Finlandia, munisipalitas Enontekiö, Inari, dan Utsjoki, dengan luas daratan 28.158 km 2 pada 1 Januari 2022 (Survei Tanah Nasional Finlandia 2022 ). Wilayah studi terletak di zona boreal utara dekat dengan batas tundra Arktik (Gambar 1 , kiri). Sementara kerja lapangan kampanye NFI baru-baru ini telah mencakup bagian lain negara dengan kisi pengambilan sampel sistematis selama 5 tahun, penilaian lapangan di Finlandia paling utara hanya dilakukan setiap tahun kesepuluh (setiap kampanye kedua), dan jaringan plot sampel lapangan yang lebih jarang digunakan di sana. Karena lintang tinggi dan elevasi yang relatif tinggi, wilayah studi jarang berhutan (lahan berhutan menutupi kurang dari 50% luas daratan) dan sebagian besar stok yang tumbuh mengelompok di bagian-bagian tertentu wilayah tersebut (Gambar 1 , kanan).

GAMBAR 1
Kiri: Lokasi area studi. Kanan: Peta volume rata-rata stok yang tumbuh (m3/ha) yang diprediksi ; metode prediksi dijelaskan dalam Lampiran A. Data peta digital: Berisi data dari peta umum Survei Tanah Nasional Finlandia 1:4,5 M 06/2015 dan pembagian kota 1:4,5 M 01/2018.

2.3 Desain NFI di Wilayah Studi
Pengambilan sampel klaster berstrata dua fase telah diterapkan dalam NFI di wilayah studi sejak 1970 (Poso dan Kujala 1971 ; Mattila 1985 ). Sampel fase pertama telah menjadi grid persegi padat dari klaster plot lapangan, yang data tambahannya diekstraksi dari peta sumber daya hutan berdasarkan pengukuran NFI sebelumnya yang dilengkapi dengan sumber data lain (Lampiran A ). Data tambahan telah digunakan untuk membagi sampel fase pertama menjadi strata, dan sampel fase kedua, klaster yang akan diukur di lapangan, telah menjadi sub-sampel berstrata dari sampel fase pertama. Dalam Lampiran B , kami menjelaskan mengapa penting untuk melakukan stratifikasi pada tingkat klaster daripada pada tingkat plot.

Di wilayah studi, klaster NFI13 (diukur pada tahun 2022) terdiri dari delapan plot sampel dengan jarak minimum 450 m antara pusat plot (Gambar 2 , kiri). Sampel klaster fase pertama dibangun dengan menempatkan titik referensi klaster pada kotak persegi dengan jarak 250 m × 250 m antara titik referensi yang berdekatan (Korhonen et al. 2024 ). Dengan demikian, kotak minimal yang memuat semua pusat plot sampel dari satu klaster secara geografis sangat tumpang tindih dengan kotak serupa dari banyak klaster fase pertama lainnya, tetapi semua pusat plot yang termasuk dalam sampel itu berbeda, seperti yang diilustrasikan dalam Gambar 2 (kanan) untuk sub-kotak 750 m × 750 m (penjarangan 3 × 3) yang digunakan dalam studi ini (Bagian 2.4 ). Semua klaster pada kotak yang mencakup setidaknya satu plot dalam area lahan wilayah studi termasuk dalam sampel fase pertama (Lampiran A ).

GAMBAR 2
Kiri: Lokasi relatif pusat plot sampel dalam satu klaster penuh (titik) dan titik referensi klaster ini (silang). Kanan: Lokasi semua pusat plot sampel dalam sub-kisi 750 m × 750 m (penjarangan 3 × 3) dari sampel fase pertama NFI13 (kisi 250 m × 250 m) yang diklasifikasikan sebagai lahan dalam persegi 4200 m × 4200 m (titik yang “hilang” adalah air). Plot tersebut berasal dari 56 klaster yang berbeda; plot dari lima klaster ditampilkan sebagai titik yang lebih besar dalam warna yang berbeda. Perhatikan bahwa bagian dari dua klaster berwarna paling selatan berada di luar persegi.

Setiap klaster fase pertama ditetapkan ke dalam satu dari lima strata yang dicirikan dalam Tabel 2 ; definisi strata yang tepat disediakan dalam Lampiran A. Tujuannya adalah untuk membuat strata klaster menurut prediksi pangsa plot hutan dan volume stok pertumbuhan yang diharapkan. Sementara klaster Strata 1 dan 2 diharapkan sebagian besar berisi plot hutan produktif, klaster Stratum 45 diharapkan sebagian besar tidak berhutan. Varians area berhutan diharapkan paling kecil di Strata 1 (> 90% berhutan) dan 45 (> 85% tidak berhutan) dan varians volume total diharapkan menurun dengan peningkatan nomor strata: Di lahan hutan produktif, volume kecil dan besar dimungkinkan, tergantung pada usia pohon, tetapi volume yang sangat besar tidak pernah tercapai di lahan yang kurang produktif dan tidak produktif.

TABEL 2. Deskripsi verbal strata, tempat semua klaster fase pertama NFI13 dari plot sampel ditetapkan. Untuk rincian stratifikasi, lihat Lampiran  A. Stratifikasi yang sama diterapkan baik dalam pengambilan sampel NFI13 aktual maupun dalam simulasi pengambilan sampel yang dilaporkan dalam makalah ini.
Lapisan Keterangan
angka 0 Klaster diperkirakan berisi plot dengan penggunaan lahan selain kehutanan.
1 Sebagian besar plot diperkirakan berada di lahan hutan produktif.
2 Sekitar setengah dari plot diharapkan berada di lahan hutan produktif.
3 Sebagian besar plot diperkirakan berada di lahan hutan yang kurang produktif atau di lahan kehutanan yang tidak produktif.
45 Sebagian besar plot diperkirakan berada di lahan kehutanan yang tidak produktif.

Stratum 0 khusus dibangun untuk memastikan penyertaan plot penggunaan lahan lain dalam sampel. Ini dianggap perlu karena lahan kehutanan meliputi lebih dari 99% wilayah daratan Finlandia Paling Utara (Korhonen et al. 2017 , Lampiran Tabel 1a, kolom J dan N/Ylä-Lappi), tetapi pemantauan penggunaan lahan lain penting untuk inventarisasi gas rumah kaca, yang menggunakan NFI untuk tujuan ini. Varians antar-klaster dari prediksi volume sebenarnya paling besar dalam stratum ini (Tabel 3 ), yang tidak mengejutkan, karena mengandung plot hutan dan plot penggunaan lahan lain, di mana pohon tidak diukur.

Lapisan,h Ah AF,h VF,h SR,h Nh πh kh Medik
angka 0 tahun 2592 Tahun 1818 10.128 24.8 5386 0,0067 tahun 12 38
1 Tahun 1947 tahun 1910 14.718 orang 20.3 4441 0,0050 14 23
2 6175 5204 31.927 orang 16.9 12.529 tahun 0,0047 tahun 15 56
3 8786 tahun 3994 13.476 orang 12.4 17.199 orang 0,0036 17 59
45 8658 tahun 1350 tahun 1676 3.3 16.891 0,0009 33 16
Semua 28.158 orang 14.275 orang 71.925 56.446 orang 0,0035 17 196

TABEL 4. Jumlah klaster, plot berhutan, dan plot tidak berhutan menurut strata dalam sampel NFI13 di wilayah studi.
Plot
Lapisan Kelompok Berhutan Tidak berhutan
angka 0 29 143 45
1 27 165 3
2 67 398 59
3 62 194 248
45 11 14 66

2.4 Simulasi Pengambilan Sampel
Simulasi pengambilan sampel yang dilaporkan dalam makalah ini ditujukan untuk mengevaluasi metode pengambilan sampel seimbang spasial yang baru dikembangkan sebagai alternatif terhadap desain fase kedua sistematis spasial yang diterapkan dalam NFI13. Kami berfokus pada pengambilan sampel fase kedua karena—seperti yang dijelaskan dan ditunjukkan dalam Lampiran D —dampak pengambilan sampel fase pertama dapat diabaikan, selama jaringan fase pertama cukup padat.

Populasi sintetis (Tabel 3 ), yang menjadi dasar simulasi desain pengambilan sampel yang dievaluasi, terdiri dari klaster yang titik referensinya terletak pada kisi persegi berukuran 750 m × 750 m, yang merupakan sub-kisi (penipisan 3 × 3) dari sampel fase pertama yang dihasilkan untuk NFI13 (Gambar 3 ), yang dikelompokkan sebagaimana dijelaskan dalam Bagian 2.3 . Salah satu dari sembilan sub-kisi yang mungkin dipilih secara acak (lihat Lampiran D untuk simulasi semua sub-kisi yang mungkin). Kami juga telah melakukan simulasi pengambilan sampel dari kisi fase pertama yang lengkap, tetapi memutuskan untuk melaporkan hasil yang—pada dasarnya identik—untuk populasi sintetis yang lebih kecil ini untuk memungkinkan replikasi lengkap dalam waktu komputasi yang wajar (semua data dan kode komputer yang diperlukan disediakan sebagai Informasi Pendukung di situs web jurnal).

GAMBAR 3
Populasi sintetis yang digunakan dalam simulasi pengambilan sampel (titik-titik dalam nuansa hijau yang menggambarkan lokasi titik referensi klaster) dan satu sampel sistematis tak berstrata dengan interval pengambilan sampel ( , titik biru).

2.5 Metode Pengambilan Sampel
Metode simulasi pengambilan sampel mencakup simple random sampling (SRS), spatially systematic sampling (SYS; Dunn dan Harrison 1993 ), generalized random-tessellation stratified design (GRTS; Stevens dan Olsen 2004 ), dan local pivotal method (LPM; Grafström et al. 2012 ). Sementara SRS berfungsi sebagai baseline yang tidak seimbang secara spasial dan SYS adalah metode terkini dari NFI Finlandia, GRTS, dan LPM merupakan alternatif yang lebih baru untuk pengambilan sampel yang seimbang secara spasial. Kedua metode ini dipilih untuk studi ini karena implementasinya dalam lingkungan R merupakan yang paling mudah diakses.

TABEL 5. Rata-rata dan simpangan baku relatif (Rsd, Persamaan  9 ) estimasi berstrata dan tak berstrata dari total volume dan area hutan di seluruh wilayah studi. Perbedaan antara rata-rata dan parameter populasi sintetis yang sesuai (Tabel  3 , “Stratum = semua”) adalah bias yang diantisipasi dan Rsd adalah galat baku relatif yang diantisipasi. Interval kepercayaan Monte Carlo 95% (di dalam tanda kurung) dihitung seperti yang dijelaskan dalam Lampiran  E. Perhatikan bahwa galat Monte Carlo yang terkait dengan pengambilan sampel sistematis tak berstrata adalah 0, karena simulasi menyeluruh dimungkinkan.
Jumlah volume Daerah hutan
Desain pengambilan sampel Berarti Rp. 1.000.000,- Berarti Rp. 1.000.000,-
Tidak berstrata
SRS 71.952 orang 7.601 (7.243, 7.942) 14.270 orang 5.087 (4.846, 5.317)
Sistem 71.918 tahun 4.440 14.274 orang 2.785
LPM 71.915 tahun 4.230 (4.045, 4.407) 14.273 orang 2.893 (2.749, 3.029)
GRT 71.835 4.716 (4.514, 4.910) 14.251 orang 3.196 (3.059, 3.327)
Berlapis
SRS 71.961 orang 3.460 (3.307, 3.606) 14.269 4.176 (3.987, 4.357)
Sistem 72.006 orang 3.218 (3.083, 3.348) 14.282 orang 3.569 (3.413, 3.718)
LPM 71.887 juta 2.977 (2.850, 3.099) 14.258 orang 3.239 (3.095, 3.376)
GRT 71.932 orang 2.949 (2.810, 3.081) 14.268 orang 3.473 (3.322, 3.617)
TABEL 6. Keteraturan spasial dan keseimbangan global sampel SRS, SYS, dan LPM yang tidak terstratifikasi yang mencakup seluruh wilayah studi dan sampel khusus strata. Untuk signifikansi perbedaan dalam SR dan perhitungan interval kepercayaan 95% Monte Carlo dari GB (di dalam tanda kurung), lihat Lampiran  E. Perhatikan bahwa kesalahan Monte Carlo yang terkait dengan pengambilan sampel sistematis adalah 0 karena simulasi menyeluruh dimungkinkan.
Keteraturan spasial, SR Keseimbangan global, GB
Lapisan Desain Berarti Rata-rata menit Maksimal
Tidak berstrata SRS 0.326 0.320 0.198 0,580 9.59 (9.22, 9.94)
Sistem 0,029 0,029 0,018 0,037 hari 2.18
LPM 0,062 0,062 0,045 pukul 0,045 0,086 tahun 0,98 (0,94, 1,01)
GRT 0,125 0,125 0,084 tahun 0.192 1,56 (1,51, 1,62)
angka 0 SRS 0.488 0.463 0.159 1.630 Tanggal 19.70 (19.02, 20.36)
Sistem 0.351 0.328 0.154 0,945 tahun 18.89
LPM 0.112 0.109 0,050 0.201 4.28 (4.14, 4.42)
GRT 0.193 0.187 0,077 tahun 0.454 6.45 (6.19, 6.70)
1 SRS 0.381 0,360 0,090 1.187 12.89 (12.42, 13.34)
Sistem 0.293 0.271 0,083 tahun 0.893 12.77
LPM 0.118 0,115 0,036 hari 0,277 tahun 5.74 (5.56, 5.92)
GRT 0.183 0,176 tahun 0,049 tahun 0.531 6.82 (6.58, 7.05)
2 SRS 0.386 0,369 tahun 0,176 tahun 0,977 tahun 12.92 (12.41, 13.41)
Sistem 0,225 0.213 0.101 0.602 11.26
LPM 0,092 0,090 0,043 tahun 0,177 tahun 2,54 (2,46, 2,62)
GRT 0.160 0,155 0,071 tahun 0.297 3.47 (3.35, 3.58)
3 SRS 0.381 0.363 0,146 tahun 0,970 16.00 (15.32, 16.64)
Sistem 0.202 0.196 0,098 0.459 11.95
LPM 0,097 tahun 0,096 tahun 0,052 0,174 tahun 3.03 (2.93, 3.13)
GRT 0,175 0.171 0,082 0,367 tahun 4,50 (4,35, 4,65)
45 SRS 0.465 0.403 0,080 2.999 38.60 (37.11, 40.04)
Sistem 0,178 0.161 0,026 0.649 Tanggal 21.13
LPM 0.114 0.110 0,033 0.283 10.05 (9.77, 10.33)
GRT 0.196 0.187 0,052 0.499 Tanggal 13.31

(12.85, 13.76)

Kesalahan standar relatif yang diantisipasi oleh simulasi pengambilan sampel juga diperbandingkan dengan kesalahan pengambilan sampel yang diestimasi dari data lapangan NFI13 aktual (Korhonen et al. 2024 ). Tata letak plot sampel lapangan NFI13 di wilayah studi sangat mirip dengan salah satu sampel SYS berstrata yang disimulasikan. Perbedaannya adalah—seperti yang dibahas dalam Bagian 2.3 dan 2.4 —bahwa sampel fase pertama yang lebih padat digunakan dalam desain NFI13, yang mengarah ke alokasi klaster fase kedua yang sedikit berbeda di antara strata (Tabel 3 , “med” vs. Tabel 4 , “Kluster”). Estimasi berstrata dari area berhutan dan volume total dihitung dari data NFI13 dengan cara yang sama seperti yang dijelaskan dalam Bagian 2.4 untuk sampel yang disimulasikan. Ketidakpastian akibat pengambilan sampel dinilai menggunakan variasi estimasi varians perkiraan yang diusulkan oleh Grafström dan Schelin ( 2014 ), yang umumnya konservatif (Räty et al. 2020 ). Definisi terperinci dari estimasi tersebut diberikan dalam Lampiran F .

3 Hasil
Bias yang diantisipasi dari semua estimator terstratifikasi dan tak terstratifikasi kurang dari 0,2% (bandingkan kolom “Rata-rata” dari Tabel 5 dengan baris “Stratum = semua” dari Tabel 3 ), yaitu, kurang dari 10% dari kesalahan standar yang diantisipasi (kolom “Rsd” dari Tabel 5 ). Ketika memperkirakan volume total, efek desain stratifikasi yang diantisipasi (dikombinasikan dengan alokasi Neyman) berkisar dari 0,21 (SRS) hingga 0,53 (SYS; Tabel 5 ). Ini berarti bahwa sampel SYS yang tak terstratifikasi akan membutuhkan hampir dua kali ukuran sampel terstratifikasi untuk menghasilkan presisi yang sama; dengan SRS, hampir lima kali lipat sampel akan diperlukan. Sebaliknya, stratifikasi meningkatkan efisiensi estimator area berhutan hanya ketika dikombinasikan dengan SRS. Ini diharapkan, karena alokasi sampel ke dalam strata dioptimalkan untuk volume total dan strata dengan intensitas pengambilan sampel terbesar, menurut desain, memiliki proporsi lahan berhutan terbesar; untuk estimasi kawasan hutan yang optimal, strata yang kurang berhutan seharusnya diambil sampelnya secara lebih intensif.

Desain yang bertujuan pada keseimbangan spasial selalu jauh lebih baik daripada SRS; efek desain berkisar dari 0,30 (area berhutan, SYS tak terstratifikasi) hingga 0,87 (volume total, SYS terstratifikasi). Dengan stratifikasi, LPM menghasilkan estimator yang lebih efisien daripada SYS baik untuk volume total (DEFF = 0,86) maupun untuk area berhutan (DEFF = 0,82). Dengan kata lain, mengganti SYS dengan LPM diharapkan menghasilkan penghematan biaya pengukuran sebesar 14%, jika diperlukan presisi minimum tertentu baik untuk area berhutan maupun untuk volume total. Hal ini jelas disebabkan oleh keteraturan spasial dan keseimbangan global yang lebih baik dari LPM dalam strata (Tabel 6 , Gambar 4 ); LPM mengungguli SYS secara konsisten di semua strata (Tabel 7 ).

GAMBAR 4
Sampel dari strata “1.” (a) Sampel sistematis dengan keteraturan spasial terburuk (0,893). (b) Bagian dari kisi persegi tempat sampel panel (a) dipilih (tanda silang hijau). Titik-titik hitam menggambarkan semua klaster populasi sintetis yang termasuk dalam strata “1,” titik-titik abu-abu menggambarkan klaster yang termasuk dalam klaster lain; di dalam persegi panjang, tidak ada klaster dalam kisi pengambilan sampel yang termasuk dalam strata “1.” (c) Sampel sistematis dengan keteraturan spasial terbaik (0,083). (d) Sampel LPM dengan keteraturan spasial median (0,118). Di panel (a), (c), dan (d), titik-titik berwarna menunjukkan semua klaster populasi sintetis yang termasuk dalam strata “1” dan klaster dalam poligon Voronoi yang terkait dengan titik sampel yang berbeda (digunakan untuk mengukur keteraturan spasial) ditampilkan dalam warna yang berbeda.

 

TABEL 7. Kesalahan standar relatif yang diantisipasi dari penaksir strata spesifik volume total dan luas hutan, % dari nilai sebenarnya.
Jumlah volume Daerah hutan
Lapisan Sistem LPM GRT Sistem LPM GRT
angka 0 8.74 7.17 7.87 5.76 4.76 5.00
1 5.35 5.00 5.04 1.14 1.10 1.11
2 4.12 3.79 4.05 1.97 1.97 1.86
3 9.36 8.58 8.97 6.37 6.28 6.16
45 38.99 tanggal 34.05 38.39 30.90 27.47 30.88

Hasil yang agak mengejutkan adalah bahwa LPM menghasilkan varians sampel yang lebih kecil dalam estimasi volume daripada SYS juga dalam pengaturan yang tidak terstratifikasi. Karena semua sampel sistematis yang tidak terstratifikasi memiliki keteraturan spasial yang lebih baik daripada semua sampel LPM, hal ini jelas disebabkan oleh keseimbangan global SYS yang lebih buruk (Tabel 6 ), dikombinasikan dengan tren volume yang kuat di seluruh wilayah (Gambar 5 ).

GAMBAR 5
Sampel sistematis yang tidak terstratifikasi dengan keseimbangan global yang buruk menghasilkan perkiraan yang lebih rendah sebesar 10% dari total volume. Rata-rata sampel -koordinatnya adalah 282,0, sedangkan rata-rata populasinya adalah 286,4 dan rata-rata sampel LPM berkisar antara 284,4 dan 289,0.

Penilaian lapangan NFI13 mengungkapkan bahwa stratifikasi tingkat klaster berhasil. Di satu sisi, sebagian besar klaster (120 dari 196) penuh, yaitu, delapan plot di lahan dalam wilayah studi, dan hanya 21 klaster yang memiliki empat plot atau kurang. Di sisi lain, hanya beberapa plot tak berhutan yang ditemukan di strata 1 dan, selain strata khusus 0, proporsi plot tak berhutan tumbuh konsisten dengan nomor strata (Tabel 4 ).

Estimasi NFI13 khusus strata dari area hutan dan volume total cukup mirip dengan rata-rata populasinya dalam sampel fase pertama (Tabel 8 vs. Tabel 3 ), yang menunjukkan bahwa data tambahan yang diperoleh sebelum pengukuran berkorelasi kuat dengan status terkini yang dinilai di lapangan. Kesalahan pengambilan sampel relatif dari volume total yang diestimasi dari data lapangan NFI13 (3,16%, Tabel 8 ) berada dalam interval kepercayaan Monte Carlo dari kesalahan pengambilan sampel yang diantisipasi (Tabel 5 ; SYS terstratifikasi).

TABEL 8. Estimasi volume total dan luas hutan berdasarkan strata spesifik dan seluruh wilayah (berstrata) berdasarkan hasil NFI13 bersama dengan estimasi kesalahan pengambilan sampel (SE), % dari estimasi.
Jumlah volume Daerah hutan
Lapisan 1000 m3 SE, % kilometer 2 SE, %
angka 0 12.538 orang 9.93 Tahun 1941 4.44
1 16.318 orang 7.03 tahun 1940 0,95
2 37.879 3.80 5394 1.23
3 14.939 9.02 3879 5.81
45 tahun 1378 24.78 tahun 1506 15.69
Seluruh wilayah 83.052 orang 3.16 14.659 orang 2.35

Kesalahan pengambilan sampel estimasi area hutan jauh lebih kecil dari yang diharapkan. Hal ini sebagian besar disebabkan oleh varians pengambilan sampel yang jauh lebih kecil dari yang diantisipasi pada strata 45 (Tabel 8 vs. Tabel 7 ). Akan tetapi, perlu dicatat bahwa estimasi varians untuk strata 45 didasarkan pada sedikitnya 11 klaster (Tabel 4 ).

4 Diskusi
Studi kasus yang dilaporkan dalam makalah ini menyoroti potensi pengambilan sampel klaster berstrata untuk survei lingkungan yang hemat biaya. Klaster titik atau plot yang akan dinilai di lapangan dapat diatur sedemikian rupa sehingga pekerjaan menjadi efisien. Dalam aplikasi kami, ini berarti bahwa semua plot dari satu klaster berada dalam jarak berjalan kaki dan jumlah plot sedemikian rupa sehingga penilaian satu klaster seharusnya memakan waktu 1 hari kerja. Dengan stratifikasi tingkat klaster, klaster yang utuh dapat dipertahankan, meskipun strata diambil sampelnya dengan intensitas yang berbeda untuk memfokuskan upaya survei pada bagian terpenting dari wilayah target. Dalam kasus ini, kami berasumsi bahwa biaya pengukuran berbanding lurus dengan jumlah klaster, yang dapat diperdebatkan berdasarkan biaya yang relatif tinggi untuk mengakses klaster dibandingkan dengan pengukuran aktual. Jika estimasi biaya relatif pengukuran klaster di strata yang berbeda tersedia, maka biaya tersebut dapat dengan mudah diperhitungkan dalam alokasi (lihat, misalnya, Tomppo et al. 2014 ).

Dalam simulasi pengambilan sampel kami, stratifikasi bekerja dengan baik karena kami memiliki data tambahan yang relatif baik—pada dasarnya peta tematik beresolusi tinggi dari variabel target utama survei berdasarkan survei serupa baru-baru ini. Misalnya, pengambilan sampel sistematis terstratifikasi 90% lebih efisien daripada pengambilan sampel sistematis tak terstratifikasi dalam estimasi total volume populasi sintetis. Hasil yang dihitung dari sampel NFI sistematis terstratifikasi aktual yang diukur di lapangan mengonfirmasi bahwa stratifikasi berhasil juga dalam aplikasi kehidupan nyata: Varians pengambilan sampel yang diestimasi dari data lapangan (3,16 2 ) adalah 51% dari yang diantisipasi untuk SYS tak terstratifikasi (4,44 2 ).

Alternatif untuk stratifikasi adalah menyebarkan sampel secara merata dalam ruang berdimensi lebih tinggi yang direntangkan oleh koordinat dan variabel tambahan lainnya (Grafström, Schnell, et al. 2017 ; Grafström, Zhao, et al. 2017 ). Pendekatan ini telah menunjukkan potensi besar untuk meningkatkan efisiensi, tetapi estimasi varians terkait terkadang terlalu optimis (Grafström, Schnell, et al. 2017 ; Räty et al. 2020 ). Sebaliknya, estimasi varians untuk pengambilan sampel berstrata bersifat kuat, selama jumlah strata sedang dan ukuran sampel mencukupi di setiap strata. Dalam kasus kami, estimasi varians dalam strata “45” ternyata agak tidak dapat diandalkan, tetapi strata itu memiliki kontribusi kecil terhadap volume total.

Meskipun alokasi yang sangat tidak proporsional (probabilitas penyertaan sampel yang sangat bervariasi) dapat sangat efisien dalam estimasi target survei yang telah dioptimalkan, alokasi tersebut juga dapat merugikan target lain yang tidak berkorelasi kuat dengan target utama. Dalam kasus kami, alokasi yang tidak proporsional dikombinasikan dengan desain yang seimbang secara spasial (SYS, LPM, dan GRTS) menghasilkan presisi yang lebih buruk dalam estimasi area hutan dibandingkan dengan versi yang tidak terstratifikasi. Dalam aplikasi saat ini, hal ini dianggap dapat diterima karena kami tahu bahwa estimasi area dapat ditingkatkan secara signifikan melalui pasca-stratifikasi tingkat plot (misalnya, Haakana et al. 2020 ).

Sudah diketahui secara umum bahwa desain pengambilan sampel yang seimbang secara spasial dapat sangat efisien dalam survei variabel target yang berkorelasi secara spasial. Dalam studi kasus kami, estimasi volume total yang tidak terstratifikasi memberikan contoh ekstrem tentang hal ini: Dibandingkan dengan SRS, efisiensi desain yang seimbang secara spasial berkisar antara 2,6 (GRTS) hingga 3,2 (LPM), yang berarti bahwa persyaratan ukuran sampel dikurangi menjadi sepertiga.

LPM ternyata lebih efisien daripada SYS dalam estimasi volume, baik yang terstratifikasi maupun tidak terstratifikasi, serta dalam estimasi terstratifikasi pada area hutan. Alasan yang jelas untuk keberhasilan LPM terstratifikasi dibandingkan dengan SYS terstratifikasi adalah karena LPM menghasilkan keseimbangan spasial yang lebih baik dalam strata yang sangat terfragmentasi: Pengambilan sampel sistematis menghasilkan keteraturan spasial yang sempurna pada persegi panjang yang berisi populasi target sementara LPM menyeimbangkan sampel terhadap populasi terbatas yang sebenarnya.

Tetapi dalam kasus estimasi volume total yang tidak terstratifikasi, kami melihat bahwa keteraturan spasial saja tidak cukup: sampel SYS jelas lebih teratur daripada sampel LPM, tetapi yang terakhir masih berkinerja lebih baik. Perbedaan dalam keseimbangan spasial global diidentifikasi sebagai penjelasan yang masuk akal; SYS dapat menyebabkan kesalahan pengambilan sampel yang relatif besar ketika grid tidak terpusat dalam kaitannya dengan wilayah survei. Dengan demikian, LPM dapat direkomendasikan sebagai alternatif yang lebih aman juga dalam kasus yang tidak terstratifikasi. Ini tampaknya bertentangan dengan hasil kami sebelumnya dalam Räty et al. ( 2020 ), tetapi jumlah klaster yang dipertimbangkan dalam penelitian itu jauh lebih besar dan tren spasial dalam populasi target kurang jelas.

Meskipun simulasi pengambilan sampel merupakan alat yang hebat untuk membandingkan desain, simulasi ini memiliki masalah yang tak terelakkan: Populasi sebenarnya tidak pernah tersedia; jika tidak, seluruh survei tidak akan diperlukan. Setiap rekonstruksi yang wajar cenderung menjadi versi yang lebih halus dari populasi sebenarnya, baik yang diproduksi dengan interpolasi geostatistik seperti yang dibahas oleh Kermorvant et al. ( 2020 ) atau dengan metode nonparametrik seperti k-NN seperti dalam penelitian ini. Dalam kasus kami, kami berasumsi bahwa citra satelit optik yang digunakan dalam interpolasi k-NN memungkinkan rekonstruksi variasi spasial yang cukup akurat dalam variabel target kami sehingga setidaknya perbandingan antara berbagai cara untuk mencapai keseimbangan spasial didasarkan pada dasar yang kuat.

Kami menggunakan peta sumber daya hutan dasar yang sama dalam stratifikasi, dalam alokasi Neyman, dan untuk menentukan “nilai sebenarnya.” Dengan demikian, baik penugasan strata maupun alokasi sampel antara strata agak “terlalu bagus,” meskipun dampak dari penggunaan tiga kali lipat data yang sama ini agak berkurang dengan menggunakannya dalam resolusi yang berbeda (stratifikasi tingkat klaster versus ekstraksi nilai sebenarnya tingkat plot). Namun, latihan kami tidak terlalu tidak realistis, karena kelas penggunaan lahan tidak berubah dengan sangat cepat dan informasi awal yang baik tentang varians dalam strata dalam volume pohon biasanya tersedia dari inventarisasi sebelumnya. Untuk antisipasi ketidakpastian pengambilan sampel yang lebih realistis, seseorang dapat menggunakan peta yang lebih lama untuk stratifikasi dan alokasi.

Bagaimanapun, simulasi pengambilan sampel tidak akan pernah dapat mengantisipasi tingkat ketidakpastian pengambilan sampel secara absolut dalam inventaris kehidupan nyata. Oleh karena itu, sangat penting untuk memvalidasi—dan menskalakan ulang, jika perlu—antisipasi berdasarkan validasi independen dengan data lapangan nyata, seperti yang diilustrasikan di sini.

Informasi Pendukung untuk artikel ini Lampiran A–F yang berisi rincian lebih lanjut tentang metode dan Informasi Pendukung yang berisi data dan kode R tersedia daring di situs web jurnal.

Leave a Reply

Your email address will not be published. Required fields are marked *