BitcoinWorld
Patronus AI pozyskuje 50 mln USD na budowę „cyfrowych światów" do testowania agentów AI
Agenci AI rozwijają się w szybkim tempie – od prostego odpowiadania na pytania przeszli do samodzielnego wykonywania złożonych, wieloetapowych zadań, takich jak rezerwacja podróży czy analiza danych finansowych. Zanim jednak agenci ci będą mogli być stosowani w rzeczywistych aplikacjach, deweloperzy potrzebują solidnych gwarancji, że działają niezawodnie w niezliczonych scenariuszach. Patronus AI, startup z siedzibą w San Francisco, założony w 2023 roku przez byłych badaczy Meta AI – Ananda Kannappana i Rebeccę Qian – pozyskał 50 milionów dolarów w rundzie finansowania serii B, aby rozwijać swoje rozwiązanie: symulowane środowiska cyfrowe służące do testowania agentów AI po treningu.
Patronus AI buduje tzw. „modele cyfrowych światów" — repliki stron internetowych i wewnętrznych systemów, w których agenci są testowani przy użyciu uczenia ze wzmocnieniem. Proces ten iteracyjnie nagradza pomyślne wykonanie zadań i karze za błędy, umożliwiając AI uczenie się na błędach w bezpiecznym, kontrolowanym środowisku. Firma porównuje swoje podejście do sposobu, w jaki Waymo trenowało pojazdy autonomiczne przy użyciu syntetycznych światów do symulowania rzadkich zagrożeń, takich jak ekstremalne warunki pogodowe czy dziecko biegnące za piłką. W przypadku agentów AI wyzwanie jest inne: często szukają skrótów, które powodują, że subtelnie zawodzą w realizacji zadań.
Rundę serii B poprowadziło Greenfield Partners, przy udziale Notable Capital, Lightspeed, Datadog i Samsung, co zwiększyło łączne finansowanie Patronus do 70 milionów dolarów. Według Glenna Solomona, dyrektora zarządzającego w Notable Capital, popyt na symulowane środowiska Patronus jest „niemal nienasycony". Przychody startupu wzrosły 15-krotnie w ciągu ostatniego roku, co odzwierciedla duże zainteresowanie zarówno czołowymi laboratoriami AI, jak i wschodzącymi startupami. „Patronus naprawdę dobrze wykrywa sztuczki i dba o to, by modele były rozliczalne" – powiedział Solomon.
Tradycyjne benchmarki często nie oddają tego, jak agent AI sprawdzi się w złożonych, rzeczywistych zadaniach. Patronus stara się wypełnić tę lukę, zapewniając środowiska, w których agenci mogą być testowani przez dłuższy czas — godziny, dni, a nawet tygodnie. Firma, obecnie skupiona na inżynierii oprogramowania i finansach, planuje rozszerzyć działalność na obszary trudniejsze do weryfikacji, takie jak zadania kreatywne czy podejmowanie otwartych decyzji. „Dziś koncentrujemy się na problemach, które są weryfikowalne" – powiedział Kannappan – „ale jest jeszcze mnóstwo obszarów, które są zupełnie nieweryfikowalne."
Patronus postrzega swoją główną konkurencję jako wewnętrzne zespoły ewaluacyjne w dużych laboratoriach AI. Podczas gdy firmy zajmujące się danymi ludzkimi, takie jak Mercor i Surge, wspomagają uczenie ze wzmocnieniem poprzez informacje zwrotne od ludzi, Patronus działa bez żadnego udziału człowieka w procesie ewaluacji. To w pełni zautomatyzowane podejście umożliwia skalowalne, spójne testowanie, które może ujawniać przypadki brzegowe i nieoczekiwane zachowania.
Najnowsza runda finansowania Patronus AI sygnalizuje rosnące zaufanie inwestorów do potrzeby rygorystycznej, zautomatyzowanej oceny agentów AI. W miarę jak agenci stają się coraz bardziej autonomiczni i zaangażowani w krytyczne zadania, narzędzia zapewniające ich niezawodność będą niezbędne. Modele cyfrowych światów firmy oferują obiecującą ścieżkę ku bezpieczniejszemu i bardziej godnemu zaufania wdrażaniu AI w różnych branżach.
P1: Jaki jest główny produkt Patronus AI?
Patronus AI buduje symulowane środowiska cyfrowe — zwane „modelami cyfrowych światów" — służące do testowania agentów AI po treningu. Te repliki stron internetowych i wewnętrznych systemów umożliwiają agentom ćwiczenie złożonych zadań i ocenę ich niezawodności.
P2: Czym Patronus AI różni się od tradycyjnych benchmarków AI?
Tradycyjne benchmarki mierzą wydajność w określonych zadaniach, ale nie oddają tego, jak agent radzi sobie z rzeczywistą złożonością, w tym z nieoczekiwanymi scenariuszami czy skrótami. Patronus wykorzystuje uczenie ze wzmocnieniem w symulowanych środowiskach, aby dokładniej testować agentów pod dużym obciążeniem.
P3: Kim są klienci Patronus AI?
Klienci startupu obejmują czołowe laboratoria AI oraz wschodzące startupy, w szczególności te tworzące agentów do inżynierii oprogramowania i finansów. Firma planuje z czasem rozszerzyć działalność na inne sektory.
Ten wpis Patronus AI pozyskuje 50 mln USD na budowę „cyfrowych światów" do testowania agentów AI pojawił się po raz pierwszy na BitcoinWorld.


