Posted in

Kuantifikasi rasio kuning telur secara non-destruktif menggunakan pencitraan hiperspektral inframerah-dekat yang tampak, pembelajaran mesin, dan AI yang dapat dijelaskan

Kuantifikasi rasio kuning telur secara non-destruktif menggunakan pencitraan hiperspektral inframerah-dekat yang tampak, pembelajaran mesin, dan AI yang dapat dijelaskan
Kuantifikasi rasio kuning telur secara non-destruktif menggunakan pencitraan hiperspektral inframerah-dekat yang tampak, pembelajaran mesin, dan AI yang dapat dijelaskan

Abstrak
LATAR BELAKANG
Kuantifikasi rasio kuning telur yang akurat dan non-destruktif memiliki signifikansi yang cukup besar bagi industri makanan, penilaian nutrisi, dan pemeringkatan telur. Pendekatan konvensional dibatasi oleh pengujian yang merusak dan hasil yang tidak memadai untuk aplikasi komersial. Studi ini menyelidiki potensi pencitraan hiperspektral (HSI) inframerah dekat-tampak (Vis-NIR; 374–1015 nm) yang dikombinasikan dengan pembelajaran mesin (ML) dan teknik kecerdasan buatan (AI) yang dapat dijelaskan untuk prediksi rasio kuning telur yang cepat dan non-destruktif. Beberapa model regresi, praproses spektral, dan teknik pemilihan fitur dievaluasi secara komprehensif untuk mengembangkan solusi prediktif yang kuat dan dapat ditafsirkan.

HASIL
Model regresi termasuk regresi kuadrat terkecil parsial (PLSR), hutan acak, peningkatan gradien ekstrem, dan regresi vektor pendukung dinilai untuk prediksi rasio kuning telur. Model PLSR yang dikombinasikan dengan praproses spektral turunan pertama Savitzky–Golay menunjukkan kinerja prediktif yang unggul dan stabil, mencapai koefisien determinasi ( R 2 ) sebesar 0,79, 0,73, dan 0,68 dalam set data kalibrasi, validasi, dan uji independen, masing-masing. Selain itu, model PLSR yang disederhanakan menggunakan beberapa variabel penting yang dipilih berdasarkan koefisien regresi mencapai hasil prediktif yang kuat. Analisis penjelasan aditif Shapley memberikan wawasan yang jelas ke dalam wilayah panjang gelombang yang berkontribusi secara signifikan terhadap prediksi model, terutama yang terkait dengan kandungan air, lipid, dan protein dalam telur.

KESIMPULAN
Penelitian ini menyoroti efektivitas Vis-NIR HSI yang terintegrasi dengan ML dan AI yang dapat dijelaskan sebagai pendekatan yang cepat, andal, dan tidak merusak untuk penilaian rasio kuning telur. Metode yang dikembangkan menawarkan keuntungan signifikan untuk pemantauan kualitas telur, menyediakan solusi praktis, dapat ditafsirkan, dan dapat diskalakan yang bermanfaat untuk aplikasi industri makanan. © 2025 Penulis. Jurnal Ilmu Pangan dan Pertanian yang diterbitkan oleh John Wiley & Sons Ltd atas nama Society of Chemical Industry.

PERKENALAN
Kuning telur merupakan komponen penting dari telur yang berfungsi sebagai sumber utama nutrisi bagi embrio yang sedang berkembang. Kuning telur kaya akan protein, lipid, vitamin, dan mineral, yang secara kolektif mendukung perkembangan embrio dan memastikan keberhasilan penetasan. 1 Kepadatan nutrisi dan sifat fungsionalnya berkontribusi secara signifikan terhadap nilai keseluruhan telur baik di pasar makanan maupun praktik penetasan. Oleh karena itu, proporsi dan komposisi kuning telur memainkan peran penting dalam konteks biologis dan komersial. Sementara kandungan kuning telur saja memberikan wawasan tentang kualitas nutrisi, rasio kuning telur, yang didefinisikan sebagai proporsi massa kuning telur relatif terhadap total massa telur, merupakan metrik yang lebih akurat dan terstandarisasi untuk mengevaluasi kualitas telur. 1 Rasio kuning telur yang lebih tinggi umumnya sesuai dengan nilai nutrisi yang lebih unggul dan peningkatan nilai pasar, menjadikannya penentu utama dalam pemeringkatan telur. Selain itu, rasio kuning telur memainkan peran penting dalam perkembangan embrio, memengaruhi daya tetas, kualitas anak ayam, dan pertumbuhan pasca penetasan. 2 Rasio kuning telur bervariasi di antara spesies dan sistem produksi, dengan telur ayam komersial biasanya berkisar antara 30% hingga 33%, sementara telur warisan dan telur yang dibesarkan di padang rumput cenderung memiliki rasio kuning telur yang sedikit lebih tinggi. 3 Persyaratan kuning telur khusus industri menggarisbawahi signifikansinya; industri roti lebih menyukai rasio kuning telur sekitar 30–32% untuk konsistensi struktural, sedangkan produk yang bergantung pada emulsifikasi seperti mayones dan saus memerlukan rasio yang lebih tinggi ( sekitar 34–36%). 1 , 4 Saat ini, penentuan rasio kuning telur konvensional sebagian besar bergantung pada metode destruktif yang melibatkan pemisahan dan penimbangan manual. Meskipun metode tradisional ini memberikan pengukuran langsung dan akurat, metode ini memiliki beberapa kelemahan signifikan, yaitu padat karya, memakan waktu, rentan terhadap kesalahan manusia, dan tidak cocok untuk aplikasi waktu nyata. 5 Selain itu, sifat destruktif dari metode ini mencegah telur digunakan untuk tujuan lebih lanjut, seperti mengevaluasi kesuburan, memantau perkembangan embrio, atau mempelajari mortalitas dan daya tetas selama inkubasi. Hal ini mengakibatkan pemborosan dan hilangnya informasi berharga yang dapat menjadi penting untuk penelitian dan pengoptimalan produksi. Keterbatasan ini menyoroti kebutuhan mendesak untuk pendekatan alternatif yang tepat, non-invasif, dan cepat. Metode yang tepat, non-invasif, dan hemat biaya untuk mengukur rasio kuning telur akan secara signifikan meningkatkan pemeringkatan telur dalam industri makanan dan meningkatkan manajemen penetasan melalui seleksi yang ditargetkan.

Dalam beberapa tahun terakhir, metode non-destruktif semakin mendapat perhatian untuk evaluasi kualitas telur yang cepat dan akurat. Pencitraan hiperspektral (HSI) telah muncul sebagai alat analisis yang ampuh untuk analisis kualitas telur, yang memungkinkan penilaian sifat internal telur tanpa mengorbankan integritas sampel. 6 – 8 Tidak seperti pencitraan konvensional dan spektroskopi berbasis titik, HSI menangkap informasi spasial dan spektral, menghasilkan kubus data tiga dimensi yang terdiri dari gambar dua dimensi yang ditumpuk di seluruh rentang panjang gelombang yang lebar. Spektrum yang dihasilkan, yang sering disebut sebagai sidik jari spektral, mencerminkan karakteristik penyerapan, refleksi, hamburan, dan emisi sampel yang unik, yang memungkinkan kuantifikasi dan diferensiasi yang tepat. Dengan menganalisis tanda-tanda spektral ini, HSI memfasilitasi estimasi rasio kuning telur yang akurat dan non-invasif. Namun, HSI berbasis reflektansi terutama menangkap informasi yang dipantulkan dari permukaan atau hanya menembus pada tingkat yang dangkal, sehingga membatasi kesesuaiannya untuk menganalisis isi internal telur. Sebaliknya, HSI transmitansi, di mana cahaya melewati seluruh sampel telur, memberikan karakterisasi internal yang lebih komprehensif. Pendekatan transmisi ini meningkatkan sensitivitas dan akurasi estimasi rasio kuning telur dengan secara efektif menangkap fitur spektral dari dalam telur, sehingga secara signifikan meningkatkan penilaian kualitas internal.

Model pembelajaran mesin (ML) mengekstrak pola yang bermakna dari kumpulan data berdimensi tinggi, memungkinkan prediksi parameter target yang cepat dan tidak merusak dengan membangun hubungan antara data spektral dan parameter target. Di antara model ML, regresi kuadrat terkecil parsial (PLSR) banyak digunakan dalam analisis data spektral karena kemampuannya untuk mengatasi kolinearitas dengan mengekstrak variabel laten independen (LV) yang mempertahankan informasi spektral penting sambil meminimalkan redundansi. 9 Sementara PLSR sering mengungguli model nonlinier tingkat lanjut seperti extreme gradient boosting (XGBoost), random forest (RF) dan support vector regression (SVR) dalam kumpulan data spektral tertentu, efektivitasnya bergantung pada data, dan model nonlinier mungkin lebih cocok untuk menangkap interaksi spektral yang kompleks. Namun, tidak ada model tunggal yang optimal secara universal, karena kinerja prediktif bergantung pada struktur data, variabilitas spektral, dan kompleksitas properti referensi. 10 – 12 Model berfitur lengkap sering kali berisiko mengalami overfitting, peningkatan beban komputasi, dan penurunan generalisasi, yang memerlukan pemilihan fitur dan pengurangan dimensionalitas. 13 Performa dapat ditingkatkan lebih lanjut melalui praproses spektral, pengoptimalan, dan ekstraksi variabel kunci. Namun, model ML konvensional sering kali dianggap sebagai model kotak hitam, yang kurang dapat ditafsirkan dan membuatnya sulit untuk memahami kontribusi variabel terhadap prediksi. 14 Ketidakjelasan ini membatasi kepercayaan dan menghambat implementasi praktis dalam aplikasi ilmiah dan industri yang sangat mengutamakan transparansi. Untuk mengatasi hal ini, mengintegrasikan AI yang dapat dijelaskan menjadi penting untuk meningkatkan transparansi dan keandalan model.

HSI dan ML telah banyak diterapkan untuk memprediksi berbagai parameter kualitas internal telur, termasuk kesegaran, 15 , 16 kandungan kuning telur ganda 17 , 18 dan kualitas putih telur. 19 Namun, penelitian terbatas telah difokuskan pada prediksi non-destruktif kandungan kuning telur dan rasio kuning telur. 20 , 21 Studi yang ada pada penentuan rasio kuning telur menggunakan spektroskopi tampak-inframerah-dekat (Vis-NIR) menyoroti perlunya mengeksplorasi teknik spektral canggih seperti HSI. Tidak seperti teknik spektroskopi berbasis titik, HSI menggunakan pemindaian area untuk menangkap spektrum lengkap untuk setiap piksel, yang memungkinkan analisis yang lebih komprehensif. Namun, studi yang ada dilakukan pada sejumlah sampel terbatas, sedangkan model kuat yang cocok untuk aplikasi industri memerlukan pelatihan pada kumpulan data yang cukup besar dan beragam untuk memastikan generalisasi. Oleh karena itu, studi yang dilaporkan di sini bertujuan untuk mengevaluasi potensi HSI dan ML untuk prediksi rasio kuning telur non-destruktif, yang mencakup berbagai variabilitas sampel. Tujuan spesifiknya adalah untuk (i) mengembangkan model PLSR, RF, XGBoost dan SVR untuk prediksi rasio kuning telur menggunakan rentang spektral penuh (374–1015 nm); (ii) mengidentifikasi serangkaian variabel penting yang optimal untuk meningkatkan ketahanan model; dan (iii) menafsirkan model berkinerja terbaik menggunakan AI yang dapat dijelaskan oleh penjelasan aditif Shapley (SHAP).

BAHAN DAN METODE
Sampel
Percobaan dilakukan dengan mengikuti protokol yang disetujui (nomor protokol: 22224) dari Kantor Wakil Rektor Bidang Riset IACUC di University of Illinois Urbana-Champaign (UIUC). Sebanyak 600 butir telur ayam bercangkang putih (303 fertil dan 297 infertil) dikumpulkan dari peternakan unggas UIUC. Pengumpulan data dilakukan selama 3 bulan untuk memastikan variabilitas sampel yang luas, dari November 2024 hingga Februari 2025. Telur memiliki rentang massa 44,8–77,9 g. Semua telur diperoleh dari ayam White Leghorn berusia 29 minggu. Telur fertil berasal dari kawanan yang dipelihara dengan ayam jantan, sedangkan telur infertil berasal dari kawanan yang dipelihara tanpa ayam jantan. Kedua kawanan dipelihara dalam kondisi lingkungan yang identik, termasuk diet, suhu, dan pencahayaan. Setelah telur yang baru diletakkan dikumpulkan, telur tersebut disimpan semalaman pada suhu ruangan (24 °C, 33% RH) sebelum dipindai dengan perangkat HSI.

Akuisisi gambar
Studi ini menggunakan sistem HSI benchtop line-scan (Gbr. 1 ) dari Resonon Inc. (Bozeman, MT, AS) untuk akuisisi gambar dalam lingkungan kamar gelap yang terkendali. Sistem ini mencakup kamera line-scanner Pika L, yang beroperasi dalam rentang spektral 374–1015 nm, yang dilengkapi dengan lensa panjang fokus 23 mm. Kamera memiliki resolusi spektral 2,7 nm, menangkap data di 281 saluran spektral dengan resolusi spasial 900 × 900 piksel. Lampu tungsten spektrum lebar 330 W digunakan untuk menerangi sampel dari bawah, sementara tahap translasi linier memfasilitasi pergerakannya. Akuisisi dan pemrosesan data dikendalikan oleh komputer yang terhubung.

GAMBAR 1
Sistem pencitraan hiperspektral pemindaian garis untuk analisis rasio kuning telur non-destruktif.

Semua pemindaian hiperspektral dilakukan menggunakan perangkat lunak Spectronon Pro (Resonon Inc., Bozeman, MT, AS). Setiap sampel ditempatkan tegak lurus dalam wadah hitam, memastikan sel udara menghadap ke atas. Untuk mencapai pencahayaan yang konsisten, sumber cahaya dipanaskan terlebih dahulu selama 30 menit sebelum pemindaian. Jarak kamera ke sampel dipertahankan pada 20 cm untuk memastikan kualitas gambar yang seragam. Selain itu, parameter akuisisi dalam perangkat lunak Spectronon Pro tetap konstan, termasuk pengaturan tahap (kecepatan pemindaian: 0,07 cm s −1 , kecepatan homing: 1,5625 cm s −1 , kecepatan joging: 0,07 cm s −1 ) dan pengaturan imager (frame rate: 9,9 fps, waktu integrasi: 100 ms, gain: 0).

Koleksi rasio kuning telur referensi
Rasio kuning telur, rasio massa kuning telur terhadap massa telur utuh, ditentukan menggunakan metode yang mudah. ​​Massa setiap telur utuh diukur terlebih dahulu, diikuti dengan pemecahan telur secara hati-hati untuk memisahkan kuning telur dari putih telur. Massa kuning telur kemudian diukur. Khususnya, pita jaringan spiral kalaza yang mengikat kuning telur tidak dihilangkan selama pemisahan kuning telur (Gbr. S1 ). Pendekatan ini meminimalkan risiko pecahnya kuning telur, memastikan penentuan massa yang akurat dan konsisten.

Segmentasi gambar dan ekstraksi spektrum
Segmentasi gambar merupakan langkah penting dalam analisis data hiperspektral, yang memungkinkan identifikasi wilayah yang diminati dengan karakteristik spektral yang serupa. Biasanya, topeng biner atau multikelas membedakan wilayah target dari latar belakang, sehingga memudahkan analisis yang terfokus. Karena kesederhanaan dan efisiensinya, segmentasi ambang batas diterapkan secara luas dalam HSI. Dalam studi ini, topeng sampel individual dibuat pada 700 nm, panjang gelombang yang memberikan kontras tertinggi antara sampel dan latar belakang. Rincian segmentasi gambar dan ekstraksi spektrum dilaporkan dalam studi sebelumnya. 22 Namun, piksel dengan nilai di atas ambang batas yang ditentukan (0,02) diberi nilai 1, sedangkan yang di bawahnya ditetapkan ke 0. Ambang batas ini ditetapkan melalui analisis eksploratori untuk memastikan segmentasi optimal, yang secara efektif mengisolasi sampel sambil mempertahankan integritas spektral. Topeng yang dihasilkan kemudian digunakan sebagai wilayah yang diminati untuk mengekstraksi nilai angka digital, yang mewakili intensitas piksel.

Analisis kemometrik
Sebelum mengembangkan model prediksi, analisis korelasi Pearson, termasuk plot pasangan dan peta panas korelasi, dilakukan untuk mengevaluasi hubungan antara rasio kuning telur, diameter mayor dan diameter minor. Untuk pengembangan model regresi, pengambilan sampel acak digunakan untuk membagi data menjadi set kalibrasi (50%), set validasi (25%) dan set uji (25%), memastikan distribusi yang tidak bias sambil mempertahankan variabilitas data. Secara umum, kinerja model yang konsisten di seluruh set validasi dan uji independen menunjukkan kekokohan dan generalisasinya.

Pengembangan model regresi
Studi ini menggunakan model PLSR, RF, XGBoost dan SVR untuk prediksi rasio kuning telur, memilih satu model representatif dari setiap kategori: linear (PLSR), berbasis ensemble (RF), boosting (XGBoost) dan berbasis kernel (SVR). Sebelum mengembangkan model regresi, berbagai teknik praproses spektral, termasuk variat normal standar (SNV), koreksi hamburan perkalian (MSC) dan penyaringan turunan pertama Savitzky–Golay (FD), diterapkan untuk meminimalkan gangguan spektral, mengoreksi pergeseran garis dasar dan meningkatkan fitur spektral yang relevan. 23 , 24 Model dengan kinerja terbaik untuk setiap algoritma ditentukan. Dalam model PLSR, jumlah LV optimal dipilih berdasarkan kesalahan akar kuadrat rata-rata (RMSE) minimum dari validasi silang 10 kali lipat. Teknik praproses spektral dan model regresi dipilih berdasarkan pengalaman sebelumnya, sifat data dan analisis eksplorasi awal. Karena tidak ada pendekatan tunggal yang efektif secara universal untuk semua kumpulan data spektral, pemilihan model disesuaikan untuk mengoptimalkan kinerja prediktif sambil memastikan ketahanan dan generalisasi.

Pemilihan fitur penting
Data spektral sering menunjukkan korelasi dan redundansi yang tinggi, yang menyulitkan analisis dan mengurangi efisiensi model. 25 , 26 Memanfaatkan rentang spektral penuh dapat memperkenalkan informasi dan gangguan yang tidak relevan, yang mengarah pada tantangan interpretasi dan prediksi waktu nyata yang kurang efektif. 27 , 28 Untuk mengatasi tantangan ini, teknik pemilihan variabel (juga disebut fitur) digunakan untuk mengidentifikasi fitur-fitur utama untuk mengembangkan model kalibrasi yang kuat. Namun, memilih fitur informatif tetap menjadi tantangan, karena tidak ada metode tunggal yang cocok secara universal untuk semua jenis sampel, yang memerlukan evaluasi komparatif. Berbagai pendekatan pemilihan fitur telah dilaporkan dalam literatur untuk analisis data spektral. 29 , 30 Dalam studi ini, competitive adaptive reweighted sampling (CARS), regression correlation correlation (RC), variable importance in projection (VIP) dan recursive feature removal (RFE) diterapkan untuk mengoptimalkan kinerja model. CARS adalah metode pemilihan variabel stokastik yang secara iteratif menghilangkan variabel yang tidak informatif berdasarkan koefisien regresinya, meningkatkan efisiensi model. RC mengidentifikasi variabel spektral yang berpengaruh berdasarkan kontribusinya terhadap model regresi, VIP memberi peringkat fitur menurut kepentingannya dalam proyeksi dan RFE secara berulang menghilangkan variabel yang paling tidak signifikan untuk menyempurnakan model dan menentukan subset yang optimal. 31 , 32

Evaluasi model
Kinerja model prediksi dievaluasi berdasarkan koefisien determinasi ( R 2 ), RMSE dan rasio prediksi terhadap deviasi (RPD) yang diperoleh dalam set kalibrasi, validasi dan pengujian. Matriks evaluasi model yang dikembangkan dihitung sebagai berikut:

Interpretasi model dengan AI yang dapat dijelaskan
AI yang dapat dijelaskan memainkan peran penting dalam meningkatkan transparansi dan interpretabilitas model, yang memungkinkan pengguna untuk memahami dan memercayai proses pengambilan keputusan. Dalam konteks ini, nilai SHAP berfungsi sebagai alat utama untuk menilai kontribusi variabel individual dalam model prediksi multivariat. Berdasarkan prinsip teori permainan kooperatif, 35 nilai SHAP mengukur pengaruh setiap variabel dengan mengevaluasi semua kemungkinan kombinasi fitur dan dampaknya masing-masing pada prediksi model. Studi ini menggunakan AI yang dapat dijelaskan SHAP untuk menafsirkan model yang paling akurat untuk prediksi rasio kuning telur. SHAP secara luas dianggap di antara berbagai teknik AI yang dapat dijelaskan karena kemampuannya untuk memberikan peringkat kepentingan fitur yang konsisten, tepat secara lokal, dan dapat ditafsirkan secara global. 36 , 37 Skor SHAP digunakan untuk memberi peringkat variabel dalam model prediksi terbaik melalui plot kepentingan SHAP, termasuk plot batang dan kawanan lebah. Plot batang memberi peringkat variabel berdasarkan nilai SHAP absolut rata-ratanya, mengidentifikasi fitur yang paling berpengaruh, sementara plot kawanan lebah memvisualisasikan distribusi nilai SHAP di seluruh sampel, menyoroti interaksi fitur dan variabilitas dalam kepentingan.

Platform komputasi
Tugas komputasi dalam studi ini dilakukan menggunakan distribusi Anaconda ( https://docs.anaconda.com/ ) dengan Python 3.9 dan MATLAB R2022a. Metode pemilihan variabel dikembangkan dari awal menggunakan pustaka NumPy dan pandas. Nilai SHAP dihitung menggunakan modul ‘shap’ untuk menginterpretasikan prediksi model. Tugas visualisasi spektral dilakukan menggunakan MATLAB. Semua perhitungan dilakukan pada komputer pribadi serbaguna yang dilengkapi dengan CPU Intel® Core™ i7-3770 3,40 GHz dan RAM 16 GB, yang beroperasi pada Microsoft Windows 10.

HASIL DAN PEMBAHASAN
Rasio kuning telur referensi
Statistik deskriptif rasio kuning telur dalam set kalibrasi, validasi, dan pengujian disajikan dalam Tabel 1. Studi ini menggunakan fraksi rasio kuning telur, bukan persentase, untuk memastikan konsistensi dalam penskalaan numerik, menyederhanakan pemodelan regresi, dan mencegah potensi bias yang disebabkan oleh transformasi berbasis persentase. Rasio kuning telur keseluruhan dalam set data berkisar antara 0,226 hingga 0,378, dengan rata-rata 0,293 dan deviasi standar (SD) 0,026.

Tabel 1. Statistik deskriptif rasio kuning telur pada set kalibrasi, validasi dan uji
Kumpulan data Jumlah sampel Rasio kuning telur
Minimum Maksimum Berarti SD
Kalibrasi 300 0.226 0,378 tahun 0.293 0,025
Validasi 150 0.233 0.362 0.291 0,025
Tes 150 0.233 0,368 tahun 0.296 0.228
Total 600 0.226 0,378 tahun 0.293 0,026

Set data kalibrasi menunjukkan kisaran rasio kuning telur 0,226 hingga 0,378, dengan rata-rata 0,293 (SD: 0,025). Set validasi menunjukkan kisaran rasio kuning telur 0,233 hingga 0,362, dengan rata-rata 0,291 (SD: 0,025), sedangkan set pengujian memiliki kisaran 0,233 hingga 0,368, dengan rata-rata yang sedikit lebih tinggi yaitu 0,296 (SD: 0,228). Kesamaan antara nilai rata-rata dan SD antara set kalibrasi, validasi, dan pengujian menunjukkan set data yang seimbang, memastikan konsistensi dalam fase pelatihan dan validasi model. Set data kalibrasi mencakup rentang rasio kuning telur yang lebih luas, praktik umum dalam pengembangan model untuk meningkatkan generalisasi dan meningkatkan kinerja prediktif pada data yang tidak terlihat. Penyelarasan statistik di seluruh subset mendukung keandalan distribusi data dan ketahanan analisis selanjutnya. Nilai rasio kuning telur yang diukur konsisten dengan temuan yang dilaporkan dalam literatur, 38 yang selanjutnya memvalidasi representatifnya himpunan data.

Studi ini mengkaji korelasi antara rasio kuning telur dan parameter morfologi utama, seperti diameter mayor dan minor (Gbr. 2 ). Plot berpasangan (Gbr. 2(a) ) secara visual menggambarkan distribusi dan hubungan berpasangan di antara variabel. Histogram diagonal menggambarkan distribusi individual, yang menunjukkan bahwa rasio kuning telur mengikuti distribusi yang relatif normal, sementara diameter mayor dan minor menunjukkan distribusi yang sedikit miring. Plot sebaran pada posisi di luar diagonal menunjukkan korelasi yang lemah antara rasio kuning telur dan diameter mayor dan minor, tanpa tren linier yang terlihat.

GAMBAR 2
Analisis korelasi rasio kuning telur dan diameter mayor dan minor telur: (a) plot berpasangan; (b) peta panas korelasi.

Peta panas korelasi (Gbr. 2(b) ) mengevaluasi hubungan antar variabel secara kuantitatif. Peta panas mengonfirmasi korelasi positif lemah antara rasio kuning telur dan diameter mayor ( r  = 0,096) dan korelasi negatif lemah antara rasio kuning telur dan diameter minor ( r  = −0,065), yang menunjukkan bahwa parameter morfologi ini memiliki pengaruh minimal pada rasio kuning telur. Namun, korelasi positif sedang ( r  = 0,463) diamati antara diameter mayor dan minor, yang menunjukkan bahwa telur dengan diameter mayor yang lebih besar cenderung memiliki diameter minor yang sedikit lebih besar. Temuan ini menunjukkan bahwa rasio kuning telur sebagian besar tidak bergantung pada parameter bentuk telur, yang memperkuat perlunya pendekatan berbasis spektral untuk prediksi yang akurat.

Sifat spektral telur
Karakteristik spektral telur ayam disajikan dalam Gambar 3. Pola spektral secara keseluruhan menunjukkan tingkat kesamaan yang tinggi, yang menunjukkan komposisi kimia yang konsisten di seluruh sampel.

GAMBAR 3
Sifat spektral telur (spektrum berwarna merah marun menunjukkan rasio kuning telur lebih besar atau sama dengan 0,3, sedangkan spektrum berwarna biru menunjukkan rasio kuning telur kurang dari 0,3): (a) Spektrum Vis-NIR semua telur; (b) spektrum rata-rata untuk kedua kelompok rasio kuning telur (≥0,3 dan <0,3). DN, nomor digital.

Spektrum telur menampilkan puncak-puncak yang berbeda pada 570, 640, 660, 687, 748 dan 771 nm, yang masing-masing sesuai dengan komponen molekuler tertentu. Puncak-puncak spektral dalam rentang Vis-NIR terutama muncul dari transisi elektronik dan nada tambahan dari getaran fundamental gugus fungsi C  H, N  H dan O  H, yang dikaitkan dengan kandungan protein, lipid dan air dalam telur. 39

Puncak pada 570 nm dikaitkan dengan karotenoid, seperti lutein dan zeaxanthin, yang berkontribusi pada pigmentasi kuning telur. 40 Pita spektral 640 nm sesuai dengan protein heme, termasuk mioglobin dan turunan hemoglobin, yang menunjukkan pembentukan darah awal. 41 Puncak 660 nm dikaitkan dengan penyerapan protein, khususnya ikatan amida yang terdapat pada protein telur. 42 Pita 687 nm sesuai dengan nada tambahan vibrasi molekul air, yang merupakan komponen penting komposisi telur. 43 , 44 Puncak pada 748 nm dikaitkan dengan kandungan lipid, terutama dari trigliserida dan fosfolipid kuning telur. 45 Puncak spektral di wilayah 771 nm terutama dikaitkan dengan nada tambahan O  H, yang menunjukkan kandungan air dalam telur. 46 Namun, puncak ini dapat dikaitkan dengan kombinasi protein dan lipid, yang mencerminkan interaksi kompleks antara makromolekul ini dalam telur. 47 Fitur spektral ini khususnya relevan untuk prediksi rasio kuning telur, karena kuning telur terutama terdiri dari lipid, protein, dan pigmen, yang memengaruhi respons spektralnya. Puncak yang terkait dengan karotenoid, lipid, dan struktur protein memberikan penanda spektral penting untuk membedakan komposisi kuning telur dari putih telur. Dengan memanfaatkan puncak spektral khusus panjang gelombang ini, Vis-NIR HSI dapat secara efektif mengukur rasio kuning telur, menawarkan pendekatan non-destruktif untuk menilai komposisi internal telur dengan presisi tinggi.

Performa model berfitur lengkap
Studi ini menilai model PLSR, RF, XGBoost dan SVR, yang masing-masing diuji dengan tiga teknik praproses spektral: MSC, SNV dan penyaringan FD. Kinerja model optimal dari setiap kategori dirangkum dalam Tabel 2 .

Tabel 2. Kinerja model panjang gelombang penuh untuk prediksi rasio kuning telur
Model Praproses spektral Kalibrasi Validasi Tes
2 RMSE 2 RMSE 2 RMSE Bahasa Indonesia: RPD
PLSR FD 0,79 0,012 0.73 0,013 0.68 0,016 1.76
Bahasa Indonesia: Frekuensi Radio FD 0,95 0,005 0.71 0,013 0.64 0,016 1.68
XGBoost Bahasa Inggris: MSC 0,98 0,001 0.62 0,015 0.53 0,019 1.49
SVR Bahasa Indonesia: SNV 0,75 0,012 0.73 0,013 0.67 0,016 1.74

PLSR, regresi kuadrat terkecil parsial; RF, hutan acak; GXBoost, peningkatan gradien ekstrem; SVR, regresi vektor pendukung; FD, turunan pertama; MSC, koreksi hamburan perkalian; SNV, variat normal standar; RMSE, kesalahan akar kuadrat rata-rata.

Di antara model yang diuji, PLSR dengan 13 LV dan praproses FD menunjukkan kinerja yang paling stabil dan dapat digeneralisasikan di seluruh set kalibrasi, validasi, dan pengujian. Plot pemilihan LV dari model FD-PLSR panjang gelombang penuh disediakan dalam informasi pendukung (Gbr. S2 ). Model FD-PLSR mencapai R2 sebesar 0,79 dalam kalibrasi, 0,73 dalam set validasi, dan 0,68 dalam set pengujian, dengan nilai RMSE yang rendah secara konsisten (masing-masing 0,012, 0,013, dan 0,016). Selain itu, nilai RPD tertinggi (1,76) dari model FD-PLSR dalam set pengujian menunjukkan kinerja model pada data independen. Dalam studi ini, personel terlatih mengumpulkan data referensi dengan hati-hati untuk memastikan keakuratan dan konsistensi. Hasilnya, nilai referensi rasio kuning telur diharapkan menunjukkan kesalahan eksperimen minimal. Oleh karena itu, kesalahan prediksi yang diamati dalam model tidak terkait dengan variabilitas dalam pengukuran referensi. Namun, plot yang tersebar dari model PLSR diberikan dalam informasi pendukung (Gbr. S3 ). Stabilitas model FD-PLSR menyoroti keefektifannya dalam menangkap fitur spektral penting sambil mengurangi noise dan overfitting.

Alasan utama kinerja PLSR yang unggul terletak pada kemampuannya untuk menangani data spektral yang sangat kolinear, fitur karakteristik spektrum telur hiperspektral. 9 PLSR unggul dalam pengurangan dimensionalitas dengan mengekstraksi LV yang mempertahankan varians yang paling relevan, secara efektif menangani multikolinearitas kuat yang ada dalam kumpulan data spektral. Sebaliknya, model nonlinier yang canggih dan canggih seperti XGBoost dan RF sering kali kesulitan dengan data kolinear, karena arsitektur berbasis pohonnya cenderung memilih fitur yang berlebihan, yang mengarah ke overfitting. 48 Fenomena overfitting terbukti dari kinerja XGBoost dan RF, yang menunjukkan nilai kalibrasi R 2 yang sangat tinggi (masing-masing 0,98 dan 0,95) tetapi mengalami penurunan tajam dalam kinerja validasi dan pengujian. Model XGBoost menunjukkan penurunan yang signifikan dalam R 2 (masing-masing 0,62 dan 0,53 untuk set validasi dan pengujian) di samping peningkatan RMSE (0,015 dan 0,019), yang menunjukkan generalisasi yang buruk. RF juga menunjukkan penurunan yang nyata dalam kemampuan prediktif ( R 2  = 0,71 dan 0,64 dalam set validasi dan pengujian), memperkuat tantangan penerapan model nonlinier pada data spektral yang sangat kolinear.

Dengan praproses SNV, SVR berkinerja sebanding dengan PLSR, mencapai R 2 sebesar 0,73 dan 0,67 dalam set validasi dan pengujian, masing-masing, yang menunjukkan kemampuannya untuk menggeneralisasi dengan baik. Namun, R 2 kalibrasi yang sedikit lebih rendah (0,75) dan nilai RMSE yang serupa menunjukkan bahwa meskipun SVR merupakan alternatif yang kompetitif, PLSR tetap menjadi pilihan yang lebih disukai karena ketahanannya, interpretabilitasnya, dan kemampuannya untuk menangani multikolinearitas spektral secara efektif.

Pemilihan fitur penting
Karena model PLSR dengan panjang gelombang penuh dengan praproses FD mengungguli model lainnya, studi ini menerapkan teknik pemilihan fitur untuk meningkatkan efisiensi dan interpretabilitasnya. Daftar fitur terpilih yang diidentifikasi oleh berbagai teknik disediakan dalam informasi pendukung (Tabel S1 ).

Meskipun semua metode pemilihan fitur mengidentifikasi panjang gelombang di seluruh rentang spektral, metode tersebut sebagian besar terkonsentrasi pada subwilayah tertentu, yang menyoroti signifikansinya dalam prediksi rasio kuning telur. Khususnya, mayoritas fitur yang dipilih dikelompokkan dalam wilayah spektral 570–630, 670–770, dan 990–1005 nm. Subwilayah ini kemungkinan menangkap variasi spektral utama yang terkait dengan komposisi kuning telur, termasuk konsentrasi pigmen, kandungan lipid, dan distribusi kelembapan, yang memengaruhi perbedaan rasio kuning telur di antara telur. 9 , 46

Daerah 570–630 nm terutama berhubungan dengan penyerapan karotenoid, khususnya lutein dan zeaxanthin, yang bertanggung jawab atas pigmentasi kuning telur. 40 Karena rasio kuning telur berhubungan erat dengan ukuran dan komposisi kuning telur, variasi kadar karotenoid dapat mencerminkan perbedaan massa kuning telur, akumulasi lipid, dan proporsi kuning telur terhadap albumen secara keseluruhan. Daerah 670–770 nm mencakup pita penyerapan air yang penting dan indikator kandungan organik. 46 Rentang spektral ini telah dikaitkan dengan nada tambahan vibrasi protein dan lipid, yang penting dalam membedakan komposisi yang didominasi kuning telur dari yang didominasi albumen. Penyerapan dalam rentang ini juga dapat berhubungan dengan perubahan struktural dalam matriks protein kuning telur, yang memengaruhi proporsi kuning telur terhadap albumen. Rentang 990–1006 nm termasuk dalam wilayah nada tambahan kedua dari vibrasi peregangan C  H dan O  H, 46 yang sangat terkait dengan kadar lipid dan air dalam kuning telur. Karena kuning telur mengandung konsentrasi lipid yang lebih tinggi daripada putih telur, fitur dalam kisaran ini kemungkinan menangkap variasi dalam ukuran kuning telur, distribusi lipid, dan retensi kelembapan, yang semuanya berkontribusi pada rasio kuning telur secara keseluruhan.46 Identifikasi yang konsisten dari wilayah spektral ini di berbagai teknik pemilihan fitur menggarisbawahi peran mendasar mereka dalam prediksi rasio kuning telur. Hal ini memperkuat hipotesis bahwa komposisi biokimia dan struktur fisik kuning telur, khususnya kandungan lipid, protein, dan airnya, berkontribusi secara signifikan terhadap ciri khas spektralnya.

Fitur-fitur terpilih yang diidentifikasi oleh RC, ditunjukkan dalam Gambar 4 , menyoroti panjang gelombang yang paling berpengaruh untuk prediksi rasio kuning telur, dengan fitur-fitur terpilih ditandai dengan titik-titik merah.

GAMBAR 4
Visualisasi panjang gelombang yang dipilih RC untuk pengembangan model PLSR yang kuat untuk prediksi rasio kuning telur.

Gambar 4 menunjukkan bahwa panjang gelombang paling berpengaruh berdasarkan RC untuk prediksi rasio kuning telur sebagian besar terkelompok dalam wilayah 390–400, 670–770, dan 790–805 nm, yang selaras dengan fitur yang dipilih oleh metode lain (Tabel S1 ). Koefisien regresi absolut yang tinggi pada wilayah-wilayah ini menunjukkan kontribusi prediktifnya yang kuat terhadap model PLSR, yang menekankan pentingnya wilayah-wilayah ini dalam menangkap variasi spektral yang terkait dengan komposisi kuning telur.

Performa model dengan fitur-fitur penting terpilih
Model PLSR dengan praproses spektral FD dikembangkan menggunakan fitur-fitur terpilih untuk mengevaluasi kemanjuran prediktif berbagai teknik pemilihan fitur. Metrik kinerja model PLSR yang menggunakan fitur-fitur yang diidentifikasi melalui metode RC, VIP, RFE, dan CARS disajikan dalam informasi pendukung (Tabel S2 ). Dibandingkan dengan model panjang gelombang penuh, penggunaan sekumpulan fitur utama yang terbatas menunjukkan hasil yang menjanjikan. Pengurangan data tersebut sangat penting untuk merancang sistem multispektral yang hemat biaya dengan kecepatan deteksi yang ditingkatkan, yang berpotensi memenuhi tuntutan operasional industri telur.

Di antara metode pemilihan fitur yang diterapkan, metode RC menunjukkan kinerja terbaik, mencapai R 2 sebesar 0,74, 0,73 dan 0,68 dalam kalibrasi, set validasi dan set uji, masing-masing, bersama dengan nilai RMSE yang rendah secara konsisten (0,02) dan RPD yang tinggi (1,92). Plot pencar model RC-PLSR dalam set validasi dan uji independen ditunjukkan pada Gambar 5. Kinerja metode RC yang unggul dapat dikaitkan dengan pemilihan fitur secara langsung berdasarkan kontribusinya terhadap prediksi model, memastikan bahwa hanya panjang gelombang yang paling informatif yang dipertahankan sambil meminimalkan redundansi. Sebaliknya, VIP, RFE dan CARS mungkin telah memilih fitur dengan relevansi yang kurang langsung terhadap prediksi rasio kuning telur, yang menyebabkan penurunan kinerja model.

GAMBAR 5
Plot sebar model PLSR berbasis fitur yang dipilih RC di set validasi (atas) dan set pengujian (bawah).

Model RC-PLSR dengan hanya 20 fitur terpilih mencapai akurasi prediktif yang sama dengan model panjang gelombang penuh meskipun menggunakan jumlah LV yang berkurang secara signifikan. Plot pemilihan LV dari model RC-PLSR disediakan dalam Gambar S4 . Sementara model PLSR panjang gelombang penuh membutuhkan 13 LV untuk kinerja optimal, model RC-PLSR mencapai hasil yang identik hanya dengan menggunakan 8 LV. Kekokohan model RC-PLSR dalam set validasi dan pengujian independen menggarisbawahi kepraktisannya untuk prediksi rasio kuning telur secara real-time, mempertahankan akurasi prediktif yang tinggi dengan lebih sedikit fitur spektral dan LV, menjadikannya ideal untuk analisis cepat dan non-destruktif dalam aplikasi industri dan penelitian.

Interpretasi model dengan penjelasan SHAP
Karena model PLSR berbasis RC menunjukkan kinerja yang unggul dengan set fitur yang dikurangi, studi ini menggunakan pendekatan AI yang dapat dijelaskan SHAP untuk menginterpretasikan model RC-PLSR untuk prediksi rasio kuning telur. Plot batang SHAP menyoroti panjang gelombang yang paling berpengaruh berdasarkan dampaknya, sementara plot SHAP beeswarm menggambarkan variabilitasnya, dengan sebaran yang lebih luas menunjukkan pentingnya yang lebih tinggi dalam prediksi model (Gbr. 6 ).

GAMBAR 6
SHAP model RC-PLSR untuk prediksi rasio kuning telur: plot batang SHAP (atas) dan plot hangat lebah (bawah).

Di antara panjang gelombang yang dipilih, dua panjang gelombang yang paling berpengaruh – 769 dan 767 nm – terkait erat dengan nada atas air (nada atas pertama dari bentangan O  H), 46 memainkan peran penting dalam membedakan komposisi telur, khususnya tingkat hidrasi dan interaksi lipid–air dalam kuning telur. Demikian pula, panjang gelombang 970 nm, pita nada atas air yang terkenal, 49 sangat terkait dengan kadar air dan interaksi ikatan hidrogen. Mengingat bahwa hidrasi kuning telur secara langsung memengaruhi distribusi kuning telur ke albumin, fitur 970 nm meningkatkan daya prediktif untuk estimasi rasio kuning telur, yang memperkuat pentingnya kadar air dalam analisis komposisi kuning telur. Panjang gelombang penting ketiga, 795 nm, sesuai dengan nada atas vibrasi NIR yang terkait dengan penyerapan asam lemak. 50 Karena kuning telur kaya lipid, panjang gelombang ini kemungkinan menangkap perbedaan dalam kandungan lipid kuning telur, yang secara langsung memengaruhi rasio kuning telur. Panjang gelombang 745 dan 743 nm dikaitkan dengan penyerapan konten organik, khususnya yang terkait dengan struktur protein dan lipid, 45 , 51 dan mencerminkan perbedaan struktural dalam viskositas dan kepadatan kuning telur, yang berkontribusi pada variasi rasio kuning telur. Panjang gelombang terpilih yang tersisa terutama sesuai dengan komponen biokimia fundamental telur, termasuk protein, lipid dan kelembaban, yang merupakan penentu penting dari rasio kuning telur. Panjang gelombang di daerah Vis-NIR dikaitkan dengan struktur sekunder protein (pita amida I, II, dan III), mode getaran lipid (nada atas C  H dan CH₂) dan pita penyerapan air ( mode peregangan dan kombinasi O  H). 46 Fitur-fitur ini secara kolektif berkontribusi pada variasi spektral yang terkait dengan komposisi kuning telur, viskositas dan integritas struktural, memperkuat hubungan yang kuat antara interaksi molekuler dan prediksi rasio kuning telur.

Plot SHAP beeswarm memberikan visualisasi yang lebih rinci tentang bagaimana panjang gelombang individual memengaruhi prediksi model. Fitur yang paling penting, 769 nm, sangat memengaruhi klasifikasi rasio kuning telur, di mana nilai fitur yang lebih tinggi (titik merah) berhubungan dengan rasio kuning telur yang meningkat, sementara nilai yang lebih rendah (titik biru) berhubungan dengan proporsi kuning telur yang lebih kecil. Tren serupa diamati pada 767 dan 795 nm, yang memperkuat relevansinya dengan interaksi air-lipid dalam kuning telur. Panjang gelombang lainnya, termasuk 745, 743, 676, dan 970 nm, menunjukkan kontribusi sedang terhadap prediksi model, terutama mencerminkan variasi struktural dan komposisi dalam kadar lipid, protein, dan kelembapan kuning telur.

KESIMPULAN
Studi ini menunjukkan kelayakan memanfaatkan Vis-NIR HSI yang digabungkan dengan teknik ML dan AI yang dapat dijelaskan untuk kuantifikasi rasio kuning telur yang tidak merusak. Di antara model regresi yang dievaluasi, PLSR dengan praproses FD memberikan kinerja prediktif yang unggul, dengan nilai R 2 yang tinggi dalam kalibrasi, validasi, dan kumpulan data uji independen. Model PLSR berbasis RC yang disederhanakan, yang dikembangkan hanya menggunakan 20 fitur spektral yang paling berpengaruh, mencapai kinerja yang sebanding dengan model fitur lengkap, dengan nilai R 2 sebesar 0,79, 0,73, dan 0,68 dalam set kalibrasi, validasi, dan uji, masing-masing. Analisis AI yang dapat dijelaskan menggunakan SHAP menawarkan wawasan yang berarti tentang kontribusi spektral yang mendasarinya, yang menyoroti panjang gelombang kritis yang terkait dengan komponen telur seperti air, lipid, dan protein, yang memainkan peran penting dalam prediksi rasio kuning telur. Interpretabilitas ini secara signifikan meningkatkan keyakinan dan penerapan teknik HSI dalam skenario penilaian kualitas makanan praktis.

Meskipun demikian, penerapan Vis-NIR HSI untuk penilaian rasio kuning telur menghadirkan tantangan, khususnya terkait variasi yang disebabkan oleh faktor lingkungan, kesegaran telur, perbedaan ras, dan sensitivitas sensor. Kompleksitas akuisisi dan pemrosesan citra hiperspektral juga menimbulkan hambatan signifikan terhadap aplikasi industri real-time dan in-line. Penelitian di masa mendatang harus mengatasi tantangan ini dengan mengembangkan teknik kalibrasi yang kuat yang mampu mengakomodasi lingkungan produksi yang beragam dan dinamis. Eksplorasi model pembelajaran mendalam, sistem pencitraan multispektral, teknik analisis spasial, dan kerangka kerja AI adaptif dapat lebih meningkatkan akurasi prediktif, resolusi spasial, dan ketahanan.

Leave a Reply

Your email address will not be published. Required fields are marked *