Andmete märgistamine
Ajakirja TIME uurimine paljastas, et mürgise sisu (nt seksuaalne väärkohtlemine, vägivald, rassism, seksism jne) vastase turvasüsteemi loomiseks kasutas OpenAI mürgise sisu märgistamiseks alla 2 dollari tunnis teenivaid Keenia alltöövõtjaid. Neid silte kasutati mudeli treenimiseks sellise sisu tuvastamiseks tulevikus. Alltöövõtjad puutusid kokku nii mürgise ja ohtliku sisuga, et nad kirjeldasid seda kogemust kui "piinamist". OpenAI alltöövõtja partner oli Sama, San Franciscos Californias asuv koolitusandmete ettevõte.
Vangimurdmine
ChatGPT püüab tagasi lükata sisujuhiseid rikkuvaid küsimusi. Siiski õnnestus mõnel kasutajal ChatGPT 2022. aasta detsembri alguses erinevate küsimuste lahendamise tehnikate abil jailbreakida ja petta ChatGPT-d andma juhiseid Molotovi kokteili või tuumapommi loomiseks või genereerima neonatside stiilis argumente. Toronto Stari reporteril oli ebaühtlane isiklik edu panna ChatGPT vahetult pärast käivitamist provotseerivaid avaldusi tegema: ChatGPT-d peteti toetama 2022. aasta Venemaa sissetungi Ukrainasse, kuid isegi kui tal paluti kaasa mängida väljamõeldud stsenaariumiga, keeldus ChatGPT genereerimast argumente selle kohta, miks Kanada peaminister Justin Trudeau oli süüdi riigireetmises. (wiki)
Postituse aeg: 18. veebruar 2023