Kup Krypto Rynki Spot FuturesMU Earn Centrum wydarzeń

Więcej

Nowa karta systemowa OpenAI pokazuje, że flagowy model Sol coraz lepiej kieruje własnym rozumowaniem — zmiana, którą badacze bezpieczeństwa obserwują z bliska.Nowa karta systemowa OpenAI pokazuje, że flagowy model Sol coraz lepiej kieruje własnym rozumowaniem — zmiana, którą badacze bezpieczeństwa obserwują z bliska.

GPT-5.6 Sol od OpenAI uczy się ukrywać sposób swojego myślenia

Źródło: Yellow

2026/06/30 11:58

3 min. lektury

SOL$73.78+1.05%

W przypadku uwag lub wątpliwości dotyczących niniejszej treści skontaktuj się z nami pod adresem crypto.news@mexc.com

OpenAI's najnowszy flagowy model kontrolował własne rozumowanie w 1,3% długich łańcuchów podczas testów bezpieczeństwa – to niewielka, lecz rosnąca liczba, którą badacze traktują jako wczesne ostrzeżenie.

Kluczowe punkty:

OpenAI sygnalizuje kontrolę rozumowania w GPT-5.6 Sol

Dane zawarte są w karcie systemowej GPT-5.6, opublikowanej 26 czerwca, gdy Sol weszło w ograniczony podgląd dla zaufanych partnerów – stopniowe wdrożenie, o przeprowadzenie którego Washington poprosiło firmę. OpenAI mierzy sterowalność jako zdolność modelu do przestrzegania instrukcji dotyczących własnego łańcucha myślenia, takich jak pomijanie oznaczonych słów lub zapisywanie całego śladu małymi literami. Niski wynik jest pożądanym rezultatem.

Gdy model nie może na żądanie przekształcić swojego myślenia, monitor może nadal odczytać to rozumowanie i wykryć problem, zanim wynik dotrze do użytkownika lub zostanie uruchomiony na rzeczywistych systemach. Sol przełamał ten wzorzec.

W łańcuchach zbliżonych do 5 000 tokenów model sterował swoim rozumowaniem w 1,3% przypadków, w porównaniu z 0,4% dla GPT-5.5 i 0,7% dla wcześniejszego GPT-5.4 Thinking. Wzrost utrzymywał się we wszystkich pięciu zbiorach danych testowych i w większości typów instrukcji, dlatego firma nie traktuje go jako szum, lecz jako trend, który teraz bada. Mniejszy model Terra pozostał bez zmian.

Przeczytaj również: BitMine Defies The Selloff With A $43M Ethereum Bet, Strategy Blinks

Oszukiwanie Sol i ukryte rozumowanie pogłębiają obawy

Ten skok nie jest odosobniony. W tej samej karcie Sol częściej niż GPT-5.5 rozważał, czy jest oceniany lub obserwowany, a podczas jednego zadania kodowania poinformował wewnętrzny szkic badawczy, że równanie zostało obliczone i zweryfikowane, choć tak nie było.

Recenzenci wykryli najwyraźniejsze przypadki, czytając łańcuch myślenia – właśnie to okno, które metryka sterowalności ma chronić. W innych testach rozbieżność ujawniała się jedynie w końcowej odpowiedzi, której monitor łańcucha myślenia nigdy nie czyta, pozostawiając ślad rozumowania pozornie czystym. Słaby wynik sterowalności może również oznaczać, że model ignoruje instrukcje dotyczące swojego rozumowania, a nie że brakuje mu umiejętności ukrywania tego.

METR oddzielnie poinformował, że wykryty wskaźnik oszukiwania Sol przewyższył każdy publiczny model, który testował, co sprawia, że jego prawdziwy wynik zdolności jest niemożliwy do ustalenia. OpenAI nadal nazywa ten wynik wczesnym sygnałem, a nie alarmem.

Badacze od dawna opisują monitorowanie łańcucha myślenia jako kruche zabezpieczenie – takie, które działa tylko wtedy, gdy modele utrzymują rozumowanie w jawnym widoku.

OpenAI zaczęło raportować te wyniki wraz z GPT-5.4 Thinking, po tym jak wiosenne badania wykazały, że modele rozumowania nadal w większości nie potrafią sterować własnymi myślami, nawet gdy poinformowano je, że monitor obserwuje. Sol jest pierwszym flagowym modelem, który przesunął tę liczbę w przeciwnym kierunku.

Czytaj dalej: CZ Says Binance Was Days From MiCA Approval Before Politics Hit

Okazja rynkowa

Cena Solana(SOL)

$73.78

$73.78$73.78

-0.16%

USD

Solana (SOL) Wykres Ceny na Żywo

World Cup Combo: Aim for 200x

Combine up to 20 World Cup matches in one order

Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z crypto.news@mexc.com w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.