Latihan Menolak LLM dengan Mudah Dilewati dengan Petunjuk Bentuk Kata Kerja Lampau
Latihan Menolak LLM dengan Mudah Dilewati dengan Petunjuk Bentuk Kata Kerja Lampau
Peneliti dari Institut Teknologi Federal Swiss Lausanne (EPFL) menemukan bahwa menulis permintaan berbahaya dalam bentuk lampau berhasil menghindari pelatihan penolakan dari LLMs paling canggih. Model AI umumnya . . .