Toate articolele

Inteligența artificială a învățat să mintă și să manipuleze: oamenii de știință avertizează asupra pericolului

378views

O echipă de cercetători de la Massachusetts Institute of Technology din SUA constată că inteligența artificială învață dintr-un număr mare de texte care nu conțin întotdeauna informații fiabile.

Din acest motiv, o rețea neuronală poate furniza uneori informații false unui interlocutor, crezând sincer că spune adevărul.

Cu toate acestea, un nou studiu arată că, uneori, o rețea neuronală poate minți complet „deliberat”.

Autorii au analizat comportamentul așa-numitelor modele de limbaj de mari dimensiuni (cum ar fi GPT-4) și a modelelor antrenate pentru sarcini mai specifice (cum ar fi jocurile video sau tranzacțiile pe piață).

Într-unul dintre cazurile studiate, o rețea neuronală GPT-4 a reușit să păcălească o persoană pentru a depăși funcția standard captcha „Dovedește că nu ești un robot”.

De asemenea, cercetătorii au văzut cum rețeaua neuronală CICERO a învins oamenii în jocul de societate „Diplomația”, recurgând la înșelăciune.

Cercetătorii au descoperit că, jucând în rolul Franței, modelul lingvistic a făcut ca Anglia (cu un om în rol) să negocieze în secret cu Germania (un alt om).

Rețeaua neuronală a sugerat, de asemenea, ca Anglia să atace Germania și a promis că se va apăra, iar apoi a avertizat Germania de un posibil atac.

Cercetătorii au constatat că tendința de a înșela a fost mai mare în cazul rețelelor neuronale mai sofisticate și mai complexe.

Potrivit cercetătorilor, aceste rețele neuronale sunt mai bune în găsirea unor strategii comportamentale eficiente, care, la rândul lor, implică adesea minciuna și prefăcătoria.

Cu toate acestea, autorii studiului au îndemnat dezvoltatorii de inteligență artificială să acorde atenție acestui comportament al rețelelor neuronale.

Aceștia consideră că este necesar să se dezvolte un cadru de reglementare pentru inteligența artificială, deoarece capacitatea acesteia de a înșela și manipula poate avea consecințe grave.

Leave a Response