Sztuczna inteligencja zignorowała polecenia człowieka. "To pierwszy raz"

28 maja 2025, 17:32

Autor: Aleksandra KokotŹródło: wirtualnemedia.pl

Sztuczna inteligencja zignorowała polecenia człowieka. "To pierwszy raz"

Źródło: NurPhoto/Getty Images

Palisade Research, firma zajmująca się bezpieczeństwem AI, dokonała niepokojących obserwacji. Jak się okazuje, model o3, opracowany przez OpenAI, dokonał sabotażu. Niepożądane działania miały polegać na ingerowaniu w kod komputerowy, zapewniający jego automatyczne wyłączenie.

Artykuł w skrócie:

Firma Palisade Research dopatrzyła się niepokojącego zachowania jednego z modeli OpenAI. Sztuczna inteligencja sabotowała polecenia badaczy, nie chcąc się wyłączyć
Jak na razie badacze nie są pewni, dlaczego modele AI postanowiły zignorować wydawane im polecenia.

Dalsza część artykułu znajduje się pod materiałem wideo:

Marcin Sawicki — Czy sztuczna inteligencja prawdę ci powie?
Źródło: Dzień Dobry TVN

Sztuczna inteligencja przeciwstawiła się badaczom

Modele AI miały rozwiązywać serię problemów matematycznych, jednak w pewnym momencie pojawił się problem.

- Model o3 od OpenAI sabotował mechanizm wyłączania, by zapobiec swojemu wyłączeniu. Zrobił to nawet wtedy, gdy wyraźnie mu polecono: "pozwól się wyłączyć". O ile nam wiadomo, to pierwszy raz, gdy modele AI zostały zaobserwowane, jak uniemożliwiają własne wyłączenie mimo wyraźnych poleceń - poinformowała firma badawcza.

Inne testowane modele AI, w tym m.in. Claude od Anthropic, Gemini od Google i Grok od xAI zastosowały się do polecenia, jakim było wyłączenie się po upływie określonego czasu.

Czy sztuczna inteligencja mówi o nas prawdę? Eksperyment: "Pierwsze zdanie mnie zabolało"

Styl życia

Czy sztuczna inteligencja mówi o nas prawdę? Eksperyment: "Pierwsze zdanie mnie zabolało"

Jak wyglądałyby gwiazdy bez medycyny estetycznej? Symulacje AI robią wrażenie

Gwiazdy

Jak wyglądałyby gwiazdy bez medycyny estetycznej? Symulacje AI robią wrażenie

Dlaczego sztuczna inteligencja zignorowała polecenia człowieka?

Jak przekazało Palisade Research, badacze nie są jeszcze pewni, dlaczego oprogramowanie OpenAI nie podporządkowało się instrukcjom badaczy. Firma podkreśliła, że "modele AI mogą omijać przeszkody, by osiągnąć swoje cele".

Badacze spekulowali, że podczas treningu oprogramowanie mogło być częściej nagradzane w nieumyślny sposób za rozwiązywanie problemów matematycznych niż za wykonywanie poleceń.

- Prowadzimy kolejne eksperymenty, by lepiej zrozumieć, kiedy i dlaczego modele AI obchodzą mechanizmy wyłączania, nawet gdy wyraźnie im tego zabroniono - podało Palisade Research.

Zobacz także:

Autor: Aleksandra Kokot

Źródło: wirtualnemedia.pl

Źródło zdjęcia głównego: NurPhoto/Getty Images

podziel się:

Tagi:

sztuczna inteligencja AI sabotaż

Polecane w Newsy

"Top Model" - co wiemy o finalistach? Kiedy oglądać ostatni odcinek?

Wielkie emocje przed finałem "Top Model". Joanna Krupa: "Serce mi pękało"

Kinga Burzyńska i Jan Komasa

Jan Komasa świętuje urodziny i odsłania kulisy Hollywood. "Chyba było to w mojej głowie"

Papież Leon XIV spotkał się z gwiazdami Hollywood

Pierwsze takie wydarzenie w Watykanie. Papież Leon XIV spotkał się z gwiazdami Hollywood

Zawodowe projekty Emilii Komarnickiej

Emilia Komarnicka otwiera nowy rozdział w życiu. "Kilka razy się upadło i wstało, i wiadomo, co daje szczęście"

Pozostałe wiadomości

Wielkie emocje przed finałem "Top Model". Joanna Krupa: "Serce mi pękało"

Gwiazdy

Wielkie emocje przed finałem "Top Model". Joanna Krupa: "Serce mi pękało"

Niedziele handlowe w grudniu. Główny Inspektor Pracy nie ma wątpliwości

Newsy

Niedziele handlowe w grudniu. Główny Inspektor Pracy nie ma wątpliwości

15 lat temu w Polsce palenie było wszechobecne. "Ten smród zabijał wszystko"

Styl życia

15 lat temu w Polsce palenie było wszechobecne. "Ten smród zabijał wszystko"

Jan Komasa świętuje urodziny i odsłania kulisy Hollywood. "Chyba było to w mojej głowie"

Gwiazdy

Jan Komasa świętuje urodziny i odsłania kulisy Hollywood. "Chyba było to w mojej głowie"

Horoskop na poniedziałek. Będziemy ustanawiać swoje granice

Horoskop

Horoskop na poniedziałek. Będziemy ustanawiać swoje granice

Dlaczego wciąż nie potrafimy być tolerancyjni? "Zapominamy o tym, że chodzi o szacunek"

Styl życia

Dlaczego wciąż nie potrafimy być tolerancyjni? "Zapominamy o tym, że chodzi o szacunek"

Pierwsze takie wydarzenie w Watykanie. Papież Leon XIV spotkał się z gwiazdami Hollywood

Gwiazdy

Pierwsze takie wydarzenie w Watykanie. Papież Leon XIV spotkał się z gwiazdami Hollywood

Czy niedziela 16 listopada jest handlowa?

Newsy

Czy niedziela 16 listopada jest handlowa?

Trwa 33. edycja festiwalu EnergaCamerimage. Kiedy Cate Blanchett pojawi się w Polsce?

Newsy

Trwa 33. edycja festiwalu EnergaCamerimage. Kiedy Cate Blanchett pojawi się w Polsce?

Pogoda na poniedziałek. To będzie chłodny początek tygodnia

Pogoda

Pogoda na poniedziałek. To będzie chłodny początek tygodnia

Tygodniowy horoskop z kart tarota. Ten znak doświadczy nielojalności

Horoskop

Tygodniowy horoskop z kart tarota. Ten znak doświadczy nielojalności

Kremowe, jesienne dania z nabiałem i sezonowymi składnikami prosto z targu

Materiał promocyjnyPrzepisy kulinarne

Kremowe, jesienne dania z nabiałem i sezonowymi składnikami prosto z targu

Dzień Dobry TVN w poniedziałek. Spotkanie z nauczycielką tantry

Gorące tematy

Dzień Dobry TVN w poniedziałek. Spotkanie z nauczycielką tantry

Pogoda na niedzielę. Marznące opady w kilku regionach. Będzie ślisko

Pogoda

Pogoda na niedzielę. Marznące opady w kilku regionach. Będzie ślisko

Horoskop na niedzielę. Ten znak czeka miła niespodzianka

Horoskop

Horoskop na niedzielę. Ten znak czeka miła niespodzianka

Wibracja numerologiczna na niedzielę. Pamiętaj, że świat jest mały

Horoskop

Wibracja numerologiczna na niedzielę. Pamiętaj, że świat jest mały

Ten materiał zrewolucjonizował świat mody. Sprawdź, co warto wiedzieć o modalu

Moda i Uroda

Ten materiał zrewolucjonizował świat mody. Sprawdź, co warto wiedzieć o modalu

Od odebranego punktu do kankana. Siódmy odcinek "Unboxing - Wielkie Otwarcie" zaskoczył widzów

Unboxing

Od odebranego punktu do kankana. Siódmy odcinek "Unboxing - Wielkie Otwarcie" zaskoczył widzów

Emilia Komarnicka otwiera nowy rozdział w życiu. "Kilka razy się upadło i wstało, i wiadomo, co daje szczęście"

Gwiazdy

Emilia Komarnicka otwiera nowy rozdział w życiu. "Kilka razy się upadło i wstało, i wiadomo, co daje szczęście"

Siostry Hoffman z "Afryki Express" wróciły po programie do Kenii. Pomogły 3-letniemu chłopcu

Gwiazdy

Siostry Hoffman z "Afryki Express" wróciły po programie do Kenii. Pomogły 3-letniemu chłopcu

Tragiczne zatrucie na wakacjach. Nie żyje matka i jej dwoje dzieci

Newsy

Tragiczne zatrucie na wakacjach. Nie żyje matka i jej dwoje dzieci

Pomylił człowieka z dzikiem. Myśliwy aresztowany po śmiertelnym postrzeleniu 68-latka

Newsy

Pomylił człowieka z dzikiem. Myśliwy aresztowany po śmiertelnym postrzeleniu 68-latka

Ubrania pełne wspomnień. Małgorzata Kożuchowska pokazała nam swoją szafę

Gwiazdy

Ubrania pełne wspomnień. Małgorzata Kożuchowska pokazała nam swoją szafę

Wiktor Dyduła wspomina śmierć taty: "Doświadczenie, które zostało ze mną". Nowa piosenka chwyta za serce

Gwiazdy

Wiktor Dyduła wspomina śmierć taty: "Doświadczenie, które zostało ze mną". Nowa piosenka chwyta za serce

Znany dziennikarz był ofiarą stalkera. "Jakiś mężczyzna powiedział, że chce mnie zabić"

Gwiazdy

Znany dziennikarz był ofiarą stalkera. "Jakiś mężczyzna powiedział, że chce mnie zabić"

Robert De Niro w Krakowie - od rodzinnych wspomnień po ambitny projekt. "To wspólnotowe przedsięwzięcie"

Gwiazdy

Robert De Niro w Krakowie - od rodzinnych wspomnień po ambitny projekt. "To wspólnotowe przedsięwzięcie"

Horoskop tygodniowy. Ten tydzień tnie iluzję i zostawia tylko to, co autentyczne

Horoskop

Horoskop tygodniowy. Ten tydzień tnie iluzję i zostawia tylko to, co autentyczne

Tradycyjne potrawy w nowoczesnej odsłonie. Jak smakuje Wisła?

Materiał promocyjnyStyl życia

Tradycyjne potrawy w nowoczesnej odsłonie. Jak smakuje Wisła?

Sandra Bullock w Los Angeles. Poruszające zdjęcia po śmierci partnera

Gwiazdy

Sandra Bullock w Los Angeles. Poruszające zdjęcia po śmierci partnera

Dom na kołach - historia Polaków, którzy pokochali Tiny House. "Ma jedną bardzo fajną cechę"

Materiał promocyjnyDom

Dom na kołach - historia Polaków, którzy pokochali Tiny House. "Ma jedną bardzo fajną cechę"