Posted in

Samudra: Emulator Laut Global AI untuk Iklim

Samudra: Emulator Laut Global AI untuk Iklim
Samudra: Emulator Laut Global AI untuk Iklim

Abstrak
Emulator AI untuk peramalan telah muncul sebagai alat yang ampuh yang dapat mengungguli prediksi numerik konvensional. Batas berikutnya adalah membangun emulator untuk simulasi iklim jangka panjang dengan keterampilan di berbagai skala spasiotemporal, tujuan yang sangat penting bagi lautan. Pekerjaan kami membangun emulator global yang terampil dari komponen lautan dari model iklim mutakhir. Kami meniru variabel lautan utama, tinggi permukaan laut, kecepatan horizontal, suhu, dan salinitas, di seluruh kedalamannya. Kami menggunakan arsitektur ConvNeXt UNet yang dimodifikasi yang dilatih pada berbagai tingkat kedalaman data lautan. Kami menunjukkan bahwa emulator lautan— Samudra —yang tidak menunjukkan pergeseran relatif terhadap kebenaran, dapat mereproduksi struktur kedalaman variabel lautan dan variabilitas antartahunannya. Samudra stabil selama berabad-abad dan 150 kali lebih cepat daripada model lautan asli. Samudra berjuang untuk menangkap besarnya tren pemaksaan yang benar dan sekaligus tetap stabil, yang membutuhkan pekerjaan lebih lanjut.

Poin-poin Utama

  • Kami mengembangkan emulator pembelajaran mesin autoregresif laut 3D global untuk studi iklim
  • Emulator, berdasarkan arsitektur UNet, stabil selama berabad-abad, menghasilkan klimatologi dan variabilitas variabel laut yang akurat
  • Pelatihan emulator kuat terhadap perubahan benih dan kondisi awal dalam data

Ringkasan Bahasa Sederhana
Alat AI sangat efektif dalam membuat prediksi cuaca yang cepat dan akurat hingga rentang waktu musiman. Menangkap perubahan dari dekade ke abad, yang muncul dari dinamika lautan, tetap menjadi tantangan yang luar biasa. Kami membangun model AI canggih yang disebut “Samudra” untuk mensimulasikan perilaku lautan global. Samudra dilatih pada data simulasi dari model iklim lautan canggih dan memprediksi fitur-fitur utama lautan seperti tinggi permukaan laut, arus, suhu, dan salinitas di seluruh kedalaman lautan. Samudra dapat secara akurat menciptakan kembali pola dalam variabel lautan, termasuk perubahan dari tahun ke tahun. Ia stabil selama berabad-abad dan 150 kali lebih cepat daripada model lautan tradisional. Namun, Samudra masih menghadapi tantangan dalam menyeimbangkan stabilitas dengan memprediksi secara akurat dampak faktor eksternal (seperti tren iklim), dan perbaikan lebih lanjut diperlukan untuk mengatasi keterbatasan ini.

1 Pendahuluan
Keberhasilan emulator baru-baru ini untuk komponen sistem iklim, terutama atmosfer, terus menghasilkan hasil yang luar biasa, mencapai kinerja canggih untuk tugas prediksi cuaca (Bi et al., 2023 ; Kochkov et al., 2024 ; Price et al., 2023 ) dan hasil yang menjanjikan dalam mereproduksi model iklim selama skala waktu dekade (Cachay et al., 2024 ) hingga multi-dekade (Watt-Meyer et al., 2023 ).

Pekerjaan yang ada pada emulasi samudra sebagian besar terbatas pada permukaan dan samudra bagian atas, atau pada pemaksaan tetap. Beberapa pekerjaan yang berfokus pada variabel samudra permukaan menunjukkan hasil untuk skala waktu tahun hingga satu dekade (Dheeshjith et al., 2024 ; Gray et al., 2024 ; Subel & Zanna, 2024 ). Emulator yang menyertakan informasi bawah permukaan telah berfokus pada skala waktu mingguan hingga dekade dan paling banyak 1.000 tahun ke atas.
(Arcomano et al., 2023 ; Guo et al., 2024 ; Holmberg et al., 2024 ; Patel et al., 2024 ; Xiong et al., 2023 ). Bire et al. ( 2023 ) mengeksplorasi skala waktu yang lebih panjang dalam model samudra yang disederhanakan dengan pemaksaan stabil yang diidealkan. Akhirnya, emulator atmosfer-samudra yang digabungkan secara musiman telah menunjukkan hasil yang menjanjikan, dengan mempertimbangkan 300
lautan (Wang et al., 2024 ). Emulator lautan dan atmosfer ini telah digunakan untuk prakiraan musiman berdasarkan data analisis ulang, dan untuk membangun pengganti model numerik.

Emulator model iklim numerik tradisional memanfaatkan efisiensi komputasi pendekatan pembelajaran mesin untuk mengurangi biaya komputasi yang seringkali mahal dalam menjalankan sejumlah besar simulasi pada model iklim asli (biasanya berbasis CPU). Salah satu manfaat utama emulator adalah kemampuan untuk menjalankan ensemble besar. Ensemble tersebut dapat digunakan untuk menyelidiki kemungkinan kejadian ekstrem, mengeksplorasi respons iklim terhadap berbagai skenario pemaksaan (misalnya, gas rumah kaca), dan memfasilitasi pengembangan model numerik dengan mengurangi jumlah eksperimen parameter terganggu yang biasanya digunakan untuk kalibrasi (Maher et al., 2021 ; Mahesh et al., 2024 ). Emulator juga dapat mempercepat integrasi spin-up model numerik atau mengganti komponen model penuh dalam pengaturan yang digabungkan (Khatiwala, 2024 ). Akhirnya, emulator dapat membantu asimilasi data, mengganti model numerik yang mahal dengan pengganti yang cepat untuk menghasilkan ensemble yang terjangkau atau adjoint perkiraan, mempertahankan akurasi dengan biaya yang berkurang (Manshausen et al., 2024 ).

Sasaran kami di sini adalah untuk mereproduksi kondisi laut dengan kedalaman penuh untuk empat variabel prognostik 3D dan satu 2D, menggunakan pemaksaan atmosfer realistis yang bergantung waktu sebagai masukan, memperluas karya Subel dan Zanna ( 2024 ); Dheeshjith dkk. ( 2024 ). Pada durasi peluncuran hampir satu dekade, emulator kami menunjukkan keterampilan yang cukup besar di beberapa diagnostik utama (rata-rata dan varians) jika dibandingkan dengan keluaran model numerik induk, yang merupakan kebenaran dasar kami. Secara khusus, baik struktur suhu sebagai fungsi kedalaman dan variabilitas El Niño-Southern Oscillation (ENSO) direproduksi dengan baik oleh emulator.

Menangkap variabel secara bersamaan dengan rentang waktu yang sangat berbeda, seperti kecepatan (yang dapat mengandung fluktuasi cepat) dan salinitas (yang biasanya berfluktuasi lebih lambat), merupakan masalah yang menonjol untuk integrasi yang panjang (sudah ditemukan oleh Subel dan Zanna ( 2024 )). Untuk mengatasi masalah ini, kami memperkenalkan emulator tambahan dengan berfokus pada variabel termodinamika (yaitu, suhu potensial dan salinitas saja). Emulator tambahan ini menangkap perubahan suhu potensial dan salinitas yang berubah secara perlahan pada rentang waktu puluhan tahun hingga berabad-abad.

Kami menunjukkan bahwa emulator kami dapat mempertahankan keterampilan dan tetap stabil selama berabad-abad untuk eksperimen yang setara dengan simulasi kontrol dan perubahan iklim. Namun, kami juga mencatat bahwa stabilitas ini disertai dengan respons yang lemah terhadap pemaksaan perubahan iklim. Karya ini menunjukkan (sejauh pengetahuan kami) emulator samudra pertama yang mampu mereproduksi struktur suhu samudra sedalam-dalamnya (dari permukaan hingga dasar samudra) dan variabilitasnya, sambil berjalan selama beberapa abad dalam konfigurasi realistis dengan pemaksaan yang bergantung pada waktu.

Makalah ini disusun sebagai berikut. Kami membahas data dan semua detail emulator di Bagian 2. Kami mengeksplorasi properti emulator yang dilatih pada set data uji dan melaporkan beberapa eksperimen multi-dekade dengan berbagai pemaksaan iklim di Bagian 3. Kami menyajikan kesimpulan kami di Bagian 4 .

2 Metode
Kami membangun emulator laut autoregresif dari data yang dihasilkan oleh simulasi laut numerik yang canggih. Di bawah ini, kami menjelaskan data, emulator, arsitektur, serta pelatihan dan evaluasi emulator.

2.1 Data
Data dihasilkan oleh OM4 (Adcroft et al., 2019 ), model sirkulasi umum samudra yang merupakan komponen samudra dari model iklim gabungan tercanggih CM4 (Held et al., 2019 ). Model sirkulasi diinisialisasi dengan hidrografi dari World Ocean Atlas (Levitus et al., 2015 ) dan dipaksa dengan analisis ulang atmosfer, mengikuti protokol OMIP-2, dengan versi 1.4 dari Analisis Ulang Atmosfer Jepang (Tsujino et al., 2020 ). Model dijalankan selama 65 tahun (1958–2022).


2.2 Emulator Laut
Variabel dalam emulator laut adalah:

GAMBAR 1
(a) Skema proses pelatihan model, yang mengilustrasikan pemetaan dari input (kondisi laut dan pemaksaan atmosfer) ke output (kondisi laut yang digulirkan selama beberapa langkah waktu). Awalnya, kondisi laut yang sebenarnya, Dan , bersamaan dengan pemaksaan atmosfer, , disediakan sebagai masukan untuk memprediksi Dan Prediksi, bersama dengan pemaksaan atmosfer yang sebenarnya, kemudian digunakan sebagai masukan untuk langkah-langkah selanjutnya dalam proses pelepasan gulungan. (b) Suhu potensial rata-rata waktu profil kedalaman-lintang selama set pengujian 8 tahun, membandingkan kebenaran dasar OM4 (kiri) dan prediksi dari (tengah) dan (kanan). (c) root mean square error (RMSE) dari prediksi set uji 8 tahun untuk kondisi awal emulator yang berbeda, Dan Titik abu-abu menunjukkan contoh RMSE dari satu peluncuran, termasuk uji coba dari pelatihan pada 5 benih model unik per emulator dan 2 peluncuran tambahan yang diinisialisasi pada status yang berjarak 6 bulan. Garis horizontal menunjukkan rata-rata RMSE masing-masing. RMSE dihitung selama periode umum setiap peluncuran.

2.3 Arsitektur
Emulator ini didasarkan pada arsitektur ConvNeXt UNet dari (Dheeshjith et al., 2024 ), di mana blok inti UNet (Ronneberger et al., 2015 ) terinspirasi oleh blok ConvNeXt (Liu et al., 2022 ) yang diadaptasi dari (Karlbauer et al., 2023 ). UNet mengimplementasikan downsampling berdasarkan pengumpulan rata-rata dan upsampling berdasarkan interpolasi bilinear, yang memungkinkannya mempelajari fitur pada berbagai skala. Setiap blok ConvNext mencakup aktivasi GeLU, peningkatan laju dilatasi, dan kemacetan saluran terbalik. Kami tidak menggunakan kedalaman saluran terbalik dan mengganti kedalaman saluran terbalik yang besar.
kernel dengan
kernel. Kami menggunakan normalisasi batch alih-alih normalisasi layer, karena menghasilkan keterampilan yang lebih baik. Encoder dan decoder terdiri dari empat blok ConvNeXt, masing-masing dengan lebar kanal [200, 250, 300, 400]. Laju dilatasi yang digunakan untuk encoder dan decoder adalah [1, 2, 4, 8]. Selain itu, kami menyertakan satu blok ConvNext (dengan lebar kanal 400 dan dilatasi 8) di bagian terdalam UNet sebelum upsampling. Jumlah total parameter model adalah 135 M. Kami menerapkan padding periodik (atau melingkar) dalam arah longitudinal dan padding nol di kutub seperti pada (Dheeshjith et al., 2024 ).

2.4 Rincian Pelatihan
Kami mengilustrasikan pelatihan model dalam (Gambar 1a ). Kami melatih emulator menggunakan 2.900 sampel data yang sesuai dengan rentang 1975-01-03 hingga 2014-09-20 dengan 50 sampel terakhir digunakan untuk validasi. Setiap sampel adalah rata-rata 5 hari dari kondisi lautan penuh dan kondisi batas atmosfer.

Kami mengabaikan data selama 1958–1975 karena pendinginan model yang berlebihan, sementara data tersebut disesuaikan dari kondisi awal yang hangat. Pendinginan ini tidak mencerminkan pemaksaan tetapi lebih merupakan penyesuaian model lautan interior (lihat Sane et al. ( 2023 ) dan Gambar S3 dalam Informasi Pendukung S1 ). Perhatikan bahwa beberapa wilayah masih mendingin pasca-1975 dalam simulasi ini, yang memengaruhi sebagian pengujian kami (lihat hasil).

Fungsi kerugian yang digunakan untuk optimasi adalah

2.5 Evaluasi
Untuk mengevaluasi emulator, kami mengambil kondisi awal dari 2014-09-30 dan menghasilkan peluncuran 8 tahun menggunakan pemaksaan atmosfer yang sesuai. Kami membandingkan keluaran dari peluncuran ini dengan data OM4 yang ditahan untuk mengevaluasi keterampilan emulator. Selain itu, kami menghasilkan uji coba yang lebih lama untuk menilai respons emulator, mirip dengan simulasi kontrol, dengan peluncuran yang sangat lama. Emulator dipaksa dengan kondisi batas atmosfer yang diambil dari tahun 1990 hingga 2000, dengan siklus 10 tahun yang berulang. Periode ini dipilih secara khusus karena memiliki pemaksaan fluks panas terintegrasi global yang mendekati nol, yang memastikan pergeseran samudra minimal. Kami juga melakukan uji coba kontrol 100 tahun dan 400 tahun (lihat Informasi Pendukung S1 ).

3 Hasil
3.1 Emulator Laut Global Kedalaman Penuh

GAMBAR 2
(a) Deret waktu rata-rata spasial dari suhu potensial pada kedalaman 2,5 (kiri) dan 775 (kanan) atas set pengujian yang membandingkan kebenaran dasar OM4 (hitam), dan prediksi dari (merah) dan (hijau). Prediksi rata-rata dan variansnya (ditunjukkan dengan bayangan) diplotkan pada lima benih pelatihan awal untuk setiap model. (b) Deret waktu indeks Nino 3.4 pada set pengujian untuk kebenaran dasar (OM4, hitam) dan prediksi ( , merah; , hijau). Anomali dirata-ratakan selama jendela 150 hari bergulir. (c)–(e) Profil kedalaman rata-rata meridional dari anomali suhu potensial di daerah tropis selama puncak peristiwa Nino (ditandai dengan titik hitam dalam rangkaian waktu) selama set uji untuk OM4 (c), (d) dan (e). Anomali pada (c)–(e) dirata-ratakan selama kurun waktu 15 hari.

 

3.2 Stabilitas Jangka Panjang
Kami juga mengevaluasi kemampuan emulator untuk menghasilkan eksperimen kontrol yang panjang, tanpa pelatihan ulang. Untuk eksperimen ini, kami menggunakan kondisi batas berulang selama 10 tahun (dijelaskan dalam Bagian 2.5 ) yang dipilih untuk memberikan fluks panas bersih mendekati nol, yang memungkinkan emulator untuk berjalan dalam jangka waktu yang lama tanpa batas sambil meminimalkan potensi pergeseran suhu.

GAMBAR 3
(a) Rata-rata suhu potensial global deret waktu selama 100 tahun kontrol berjalan, membandingkan kebenaran dasar 10 tahun OM4 (hitam) dan prediksi dari (merah) dan (hijau). (b) Suhu potensial rata-rata waktu profil kedalaman selama 100 tahun kontrol berjalan, membandingkan kebenaran dasar OM4 10 tahun (kiri) dan prediksi dari (tengah) dan (kanan). (c) Deret waktu indeks Nino 3.4 selama rentang kontrol 100 tahun, membandingkan pengulangan 10 tahun untuk kebenaran dasar (OM4, hitam) dan prediksi ( , merah; (d)–(e) Profil kedalaman rata-rata meridional dari anomali suhu potensial di daerah tropis selama puncak peristiwa Nino (ditandai dengan titik hitam dalam rangkaian waktu) selama set pengujian untuk (d) dan (e). Anomali seperti pada Gambar 2 .

 

4 Diskusi
Kami menghasilkan emulator pembelajaran mesin (ML) yang murah secara komputasional dari model samudra mutakhir, yaitu OM4 (Adcroft et al., 2019 ). Arsitektur ML terdiri dari ConvNeXt UNet yang dimodifikasi (Dheeshjith et al., 2024 ). Model orde tereduksi — Samudra —memprediksi variabel samudra utama, tinggi permukaan laut, suhu, dan salinitas, di seluruh kedalaman samudra dunia sambil tetap stabil selama berabad-abad. Mengintegrasikan OM4 selama 100 tahun membutuhkan waktu sekitar 8 hari dengan menggunakan 4.671 inti CPU, sedangkan emulator (termo) tercepat kami menyelesaikan tugas yang sama dalam waktu sekitar 1,3 jam pada satu GPU A100 40 GB. Ini mewakili peningkatan sekitar 150x dalam tahun simulasi per hari untuk Samudra dibandingkan dengan OM4. Sebagian dari peningkatan kecepatan ini dapat dikaitkan dengan Samudra: (a) menggunakan langkah waktu 5 hari (vs. 15 menit di OM4); (b) beroperasi pada grid yang secara spasial lebih kasar. Akan tetapi, kami mencatat bahwa Samudra membuat prediksi dengan keterampilan spasial implisit dari resolusi OM4 yang lebih halus, sedangkan Model Sirkulasi Umum (GCM) yang lebih kasar dengan parameterisasi eddy cenderung menunjukkan bias yang lebih buruk (misalnya, lihat Gambar 9 dari Adcroft et al. ( 2019 ) untuk GCM 1/2 derajat).

Emulator ini bekerja dengan baik pada berbagai metrik yang terkait dengan klimatologi model dan variabilitasnya pada set pengujian dan simulasi kontrol yang panjang. Emulator ini menghasilkan klimatologi yang akurat selama 8 tahun terakhir simulasi OM4 dan tangguh terhadap perubahan benih dan kondisi awal. Lebih jauh, emulator ini dapat menangkap variabilitas (misalnya, respons ENSO terhadap pemaksaan). Oleh karena itu, emulator ini dapat digunakan untuk mempelajari lautan dan iklim kontemporer dengan pengurangan biaya yang signifikan dibandingkan dengan OM4.

Namun, emulator tersebut kesulitan untuk menangkap tren di bawah berbagai pemaksaan fluks panas permukaan (lihat Informasi Pendukung S1 ), mirip dengan emulator permukaan di Dheeshjith et al. ( 2024 ). Kami melakukan eksperimen paksa yang diidealkan menggunakan pemaksaan atmosfer berulang yang sama yang dihasilkan untuk eksperimen kontrol dan pemaksaan linier seragam spasial dengan besaran yang bervariasi untuk fluks panas permukaan. Gambar S16 dalam Informasi Pendukung S1 menunjukkan tren kandungan panas laut yang diprediksi oleh
pada kenaikan fluks panas permukaan linier sebesar 1, 0,5, 0,25, dan 0
Pola penyerapan panas samudra mengingatkan kita pada eksperimen numerik yang hanya melibatkan samudra dan eksperimen yang melibatkan gaya yang digabungkan (Couldrey et al., 2020 ; Todd et al., 2020 ), dengan pola dipol di wilayah tenggelamnya Samudra Selatan dan Atlantik Utara (Gambar S14 dalam Informasi Pendukung S1 ). Namun, besarnya perubahan terlalu lemah dibandingkan dengan gaya yang dipaksakan (Gambar S16 dalam Informasi Pendukung S1 ). Perilaku serupa dari generalisasi lemah di bawah perubahan iklim juga diamati dalam emulator iklim atmosfer, ACE (Watt-Meyer et al., 2023 ), tetapi membaik ketika model samudra lempeng ditambahkan (Clark et al., 2024 ).

Di sini, kami tidak dapat menghasilkan emulator yang secara bersamaan menangkap tren dalam data uji dan tetap stabil selama berabad-abad. Pekerjaan lebih lanjut diperlukan untuk mengeksplorasi alasan masalah tersebut dan akan memerlukan simulasi numerik baru.

Kurangnya generalisasi yang tercermin dalam tren pemanasan yang lemah dapat disebabkan oleh data pelatihan. Efek dari pergeseran awal dapat dikurangi dengan memangkas tahun 1958–1975 dari data pelatihan, yang menghilangkan sebagian besar periode penyesuaian ini. Namun, kedalaman dan wilayah yang berbeda menyesuaikan lebih lambat, dan beberapa penyesuaian berkelanjutan ini mungkin tetap ada dalam data karena skala waktu keseimbangan model adalah ratusan tahun. Alasan lain untuk bias tren dapat menjadi kumpulan data pemaksaan. Pemaksaan atmosfer yang dikenakan pada lautan secara implisit merupakan hasil dari kopling lautan-atmosfer yang sebenarnya. Oleh karena itu, pemaksaan atmosfer telah merasakan perubahan sirkulasi lautan, khususnya di Atlantik Utara (Chemke et al., 2020 ). Efek yang dihasilkan adalah bahwa ” pemaksaan” yang diterapkan pada emulator lautan tidak sepenuhnya dipisahkan dari respons lautan, yang berpotensi menyebabkan beberapa bias dalam respons, seperti dalam Todd et al. ( 2020) ; Zanna et al. ( 2019 ). Kami mengatasi masalah ini dengan menambahkan masukan pemaksaan tambahan, yaitu pemaksaan panas kumulatif, yang menghasilkan model yang lebih canggih yang mampu menangkap tren pemanasan global. Namun, model ini tidak stabil di bawah pemaksaan perubahan iklim selama 50 tahun terakhir. Atau, mungkin saja pembelajaran untuk memprediksi status model secara langsung tidak optimal. Kami mengeksplorasi kecenderungan pembelajaran, yang meningkatkan kinerja untuk tren pemanasan tetapi, sekali lagi, tidak stabil dalam jangka waktu yang panjang. Tantangan ke depannya adalah merancang emulator yang andal yang mampu menangkap tren sambil tetap stabil dalam peluncuran yang panjang.

Meskipun responsnya terbatas terhadap pemaksaan iklim di masa mendatang, Samudra terampil dalam meniru lautan kontemporer dan karenanya merupakan tiruan yang terjangkau dari model sirkulasi lautan yang mahal. Tanpa modifikasi lebih lanjut, Samudra dapat digunakan dalam studi yang memerlukan ansambel besar (misalnya, kuantifikasi ketidakpastian, kejadian ekstrem) atau untuk meningkatkan dan mempercepat aplikasi operasional (misalnya, asimilasi data). Lebih banyak peluang muncul jika kita mempertimbangkan penyempurnaan pelatihan untuk Samudra, misalnya, ke versi revisi OM4 atau model lain, yang dapat mempercepat pengembangan model iklim dengan memungkinkan evaluasi peluncuran yang panjang, namun terjangkau. Ini termasuk menggabungkan Samudra dengan emulator iklim atmosfer (Watt-Meyer et al., 2023 ) untuk meniru CM4.

Leave a Reply

Your email address will not be published. Required fields are marked *