Simetri: Solusi untuk Masalah Set Data Kecil Menurut Peneliti MIT
Symmetry could solve small dataset woes, says MIT researchers https://dailyai.com/2024/02/symmetry-could-solve-small-dataset-woes-says-mit-researchers/

By Sang Ruh 09 Feb 2024, 00:41:50 WIB | 👁 167 Programming
Simetri: Solusi untuk Masalah Set Data Kecil Menurut Peneliti MIT

Keterangan Gambar : Simetri: Solusi untu


Peneliti MIT telah menemukan bagaimana memanfaatkan konsep simetri dalam kumpulan data dapat mengurangi volume data yang diperlukan untuk melatih model. Penemuan ini, didokumentasikan dalam sebuah studi yang dapat diakses melalui ArXiv oleh Behrooz Tahmasebi, seorang mahasiswa doktoral MIT, dan pembimbingnya, Stefanie Jegelka, seorang profesor muda di MIT, berakar dalam wawasan matematika dari hukum berusia satu abad yang dikenal sebagai hukum Weyl.

Hukum Weyl, yang awalnya dirumuskan oleh matematikawan Jerman Hermann Weyl lebih dari 110 tahun yang lalu, dirancang untuk mengukur kompleksitas informasi spektral, seperti getaran alat musik. Terinspirasi oleh hukum ini saat mempelajari persamaan diferensial, Tahmasebi melihat potensinya untuk mengurangi kompleksitas data yang dimasukkan ke dalam jaringan saraf tiruan. Dengan memahami simetri yang melekat dalam kumpulan data, model pembelajaran mesin dapat dibuat lebih efisien dan lebih cepat tanpa menambahkan lebih banyak data secara numerik.

Studi Tahmasebi dan Jegelka menjelaskan bagaimana memanfaatkan simetri, atau "invariansi," dalam kumpulan data dapat menyederhanakan tugas pembelajaran mesin, yang pada gilirannya memerlukan lebih sedikit data pelatihan.

Namun, studi ini lebih dalam dari simetri dalam arti konvensional. Invariansi Kernel Ridge Regression (KRR) mencakup transformasi simetris seperti rotasi, refleksi, dan karakteristik data lainnya yang tetap tidak berubah di bawah operasi tertentu.

Penelitian ini awalnya disajikan pada konferensi Neural Information Processing Systems bulan Desember 2023. Ini sangat penting dalam bidang seperti kimia komputasi dan kosmologi, di mana data berkualitas terbatas. Data yang jarang sangat umum dalam bidang di mana kumpulan data sangat besar, tetapi data yang benar-benar berguna dalam kumpulan tersebut sangat terbatas.

Manfaat dan hasil

Peneliti mengidentifikasi dua jenis peningkatan dari memanfaatkan simetri: peningkatan linear, di mana efisiensi meningkat sebanding dengan simetri, dan keuntungan eksponensial, yang menawarkan manfaat yang jauh lebih besar ketika berurusan dengan simetri yang meliputi beberapa dimensi.

Dengan memanfaatkan simetri dalam struktur molekuler, model pembelajaran mesin dapat memprediksi interaksi dan properti dengan lebih sedikit titik data, membuat proses penemuan obat lebih cepat dan efisien.

Simetri juga dapat membantu dalam menganalisis fenomena kosmik, di mana kumpulan data sangat besar namun jarang diisi oleh data yang berguna. Misalnya, memanfaatkan simetri dalam mempelajari radiasi latar belakang kosmik atau struktur galaksi dapat memungkinkan ilmuwan untuk mengekstrak lebih banyak wawasan dari data yang terbatas.

Dengan memanfaatkan simetri dalam struktur molekuler, model pembelajaran mesin dapat memprediksi interaksi dan properti dengan lebih sedikit titik data, membuat proses penemuan obat lebih cepat dan efisien.

Simetri juga dapat membantu dalam menganalisis fenomena kosmik, di mana kumpulan data sangat besar namun jarang diisi oleh data yang berguna. Misalnya, memanfaatkan simetri dalam mempelajari radiasi latar belakang kosmik atau struktur galaksi dapat memungkinkan ilmuwan untuk mengekstrak lebih banyak wawasan dari data yang terbatas.

View all comments

Write a comment