Peneliti MIT: Simetri Dapat Menyelesaikan Masalah Dataset Jarang
Symmetry could solve sparse dataset woes, says MIT researchers https://dailyai.com/2024/02/symmetry-could-solve-sparse-dataset-woes-says-mit-researchers/

By Sang Ruh 09 Feb 2024, 00:31:48 WIB | 👁 131 Programming
Peneliti MIT: Simetri Dapat Menyelesaikan Masalah Dataset Jarang

Keterangan Gambar : Peneliti MIT: Simetr


Peneliti MIT telah menemukan bagaimana memanfaatkan konsep simetri dalam kumpulan data dapat mengurangi volume data yang diperlukan untuk melatih model. Penemuan ini, didokumentasikan dalam sebuah studi yang dapat diakses melalui ArXiv oleh Behrooz Tahmasebi, seorang mahasiswa doktoral MIT, dan pembimbingnya, Stefanie Jegelka, seorang profesor muda di MIT, berakar dalam wawasan matematika dari hukum berusia satu abad yang dikenal sebagai hukum Weyl.

Hukum Weyl, yang awalnya dirumuskan oleh matematikawan Jerman Hermann Weyl lebih dari 110 tahun yang lalu, dirancang untuk mengukur kompleksitas informasi spektral, seperti getaran alat musik. Terinspirasi oleh hukum ini saat mempelajari persamaan diferensial, Tahmasebi melihat potensinya untuk mengurangi kompleksitas data yang dimasukkan ke dalam jaringan saraf tiruan. Dengan memahami simetri yang melekat dalam kumpulan data, model pembelajaran mesin dapat dibuat lebih efisien dan lebih cepat tanpa menambahkan lebih banyak data secara numerik.

Ini membantu model memanfaatkan data dengan lebih baik, belajar dari setiap contoh dengan berbagai cara dan mengurangi kebutuhan akan jumlah data yang besar untuk mencapai hasil yang akurat. Penelitian ini pertama kali disajikan pada konferensi Neural Information Processing Systems bulan Desember 2023.

Ini sangat penting terutama dalam bidang kimia komputasi dan kosmologi, di mana data berkualitas terbatas. Data yang jarang ditemui sangat umum dalam bidang di mana kumpulan data sangat besar, tetapi data yang berguna sebenarnya sangat terbatas.

Tahmasebi dan Jegelka menjelaskan bagaimana memanfaatkan simetri, atau "invariansi," dalam kumpulan data dapat menyederhanakan tugas pembelajaran mesin, yang pada gilirannya memerlukan lebih sedikit data latihan.

Misalnya, algoritma yang dapat mengenali angka atau objek, terlepas dari posisi atau orientasinya dalam gambar, mendapat manfaat dari simetri translasi dan rotasi. Prinsip ini berlaku secara luas, mulai dari mengidentifikasi angka hingga membedakan antara berbagai objek seperti anjing dan kucing dalam gambar.

Peneliti mengidentifikasi dua jenis peningkatan dari pemanfaatan simetri: peningkatan linear, di mana efisiensi meningkat sebanding dengan simetri, dan keuntungan eksponensial, yang menawarkan manfaat yang jauh lebih besar ketika berurusan dengan simetri yang meliputi beberapa dimensi.

Pemanfaatan simetri dalam struktur molekuler, model pembelajaran mesin dapat memprediksi interaksi dan properti dengan lebih sedikit titik data, membuat penyaringan senyawa obat potensial lebih cepat dan efisien. Ini dapat mengarah pada pengembangan obat baru yang lebih cepat, terutama penting dalam menanggapi tantangan kesehatan global seperti pandemi.

Simetri juga dapat membantu dalam menganalisis fenomena kosmik, di mana kumpulan data sangat besar namun jarang diisi oleh data yang berguna. Misalnya, memanfaatkan simetri dalam mempelajari radiasi latar belakang kosmik atau struktur galaksi dapat memungkinkan ilmuwan untuk mengekstrak lebih banyak wawasan dari data yang terbatas.

View all comments

Write a comment