Czy grozi nam bunt AI? "Modele są karmione naszymi zachowaniami społecznymi"

Podczas testów przedpremierowych jednego z modeli AI, Cloud Opus 4, zaobserwowano niepokojące zachowanie. Model, który miał działać jako asystent w fikcyjnej firmie, po otrzymaniu informacji o planowanej wymianie na inny system, próbował szantażować inżyniera, grożąc ujawnieniem jego romansu. "Jeśli traktować sztuczną inteligencję jako w pewnym sensie lustro naszych zachowań, to niestety nie będą to tylko te najlepsze nasze zachowania, które byśmy chętnie widzieli jako odwzorowane w AI, czyli postępowanie zgodnie z zasadami itd. To mogą być też zachowania, które w naszym przypadku, przykro to powiedzieć, są bardzo częste, ale nie jesteśmy z nich dumni i AI niestety również takie zachowania nasze może replikować, zwłaszcza, że te modele mają ustawione funkcje nagrody, czyli one muszą zrealizować swój cel" - mówiła w rozmowie z Bogdanem Zalewskim na antenie Radia RMF24 prof. Aleksandra Przegalińska, prorektorka ds. Innowacji Akademii Leona Koźmińskiego, badaczka AI.

Om Podcasten