Firmy, które przez ostatni rok agresywnie nakłaniały pracowników do korzystania z narzędzi AI, teraz mają trudności z zarządzaniem kosztami.
Dyrektorzy finansowi (CFO) domagają się teraz wymiernych zwrotów z coraz wyższych rachunków za API, co zagraża prognozom wzrostu OpenAI, Anthropic i innych dostawców dużych modeli językowych.

Firmy ograniczają teraz wydatki na AI, ponieważ CFO domagają się uzasadnienia dla rosnących rachunków za API. Ten zwrot oznacza koniec tego, co branża nazwała „tokenmaxxingiem", a korekta następuje błyskawicznie.
Amazon niedawno zlikwidował wewnętrzną tablicę wyników śledzącą wykorzystanie AI przez pracowników, po tym jak kierownictwo doszło do wniosku, że system generuje więcej zbędnej pracy napędzanej przez AI niż użytecznych wyników. „Proszę, nie używajcie AI tylko po to, żeby używać AI" – powiedział pracownikom wiceprezes Amazona.
Uber wydał cały budżet na kodowanie AI na rok 2026 w ciągu czterech miesięcy, a Meta wysłała wewnętrzne memorandum do około 6 000 pracowników, sygnalizując to, co nazwała „wykładniczym wzrostem" wykorzystania AI, ostrzegając, że firma może ponieść miliardy dolarów wewnętrznych kosztów AI. Uber wprowadził od tego czasu miesięczny limit wydatków na narzędzia do kodowania AI w wysokości 1 500 USD na pracownika.
Gigant konsultingowy Accenture wcześniej ostrzegał pracowników, że mogą „ryzykować utratę awansów", jeśli nie przyjmą narzędzi AI. Teraz Accenture stara się powstrzymać pracowników przed używaniem AI do błahych zadań.
Ujawnione nagranie z wewnętrznego spotkania utrwaliło wypowiedź dyrektora Accenture, który stwierdził, że wydatki na AI „stają się bardzo nieprzewidywalne". Ten sam dyrektor powiedział, że kierownictwo na „poziomie CFO, COO i CIO nadal zadaje pytanie, czy uzyskują wartość z tego, co wydajemy".
Adam McDaniel i Markus Eisele z International Business Machines (IBM) argumentowali w niedawnej analizie, że minimalizacja tokenów jest równie zła jak tokenmaxxing, ponieważ oba podejścia czynią zużycie tokenów głównym celem, zamiast skupiać się na wynikach biznesowych.
IBM propaguje to, co nazywa „valuemaxxingiem", który koncentruje się na mierzeniu wykonanych zadań, zaoszczędzonego czasu i unikniętych przeróbek, a nie zużytych tokenów.
OpenAI i Anthropic zbudowały swoje plany wzrostu na założeniu, że przedsiębiorstwa będą konsumować coraz więcej tokenów.
OpenAI przekroczył w tym roku 25 miliardów dolarów rocznych przychodów, wyceniając się na 1 bilion dolarów, podczas gdy Anthropic jest wyceniany o kilka miliardów dolarów mniej. Obie firmy spalają gotówkę na obliczenia, badania i rekrutację, mając nadzieję, że adopcja przez przedsiębiorstwa uczyni je rentownymi.
Jednak przedsiębiorstwa już teraz rezerwują drogie modele flagowe do złożonych zadań, a do rutynowych używają mniejszych, tańszych alternatyw. Niektóre przenoszą obciążenia robocze na modele open-source działające na własnej infrastrukturze, bez opłat za tokeny.
International Data Corporation (IDC) przewiduje, że do 2028 roku 70% wiodących przedsiębiorstw opartych na AI będzie korzystać z wielu modeli zamiast polegać na jednym dostawcy. Przekształciłoby to AI w towar, w którym dostawcy konkurują ceną, a nie tylko możliwościami.
Kwestia kosztów jednak nigdzie nie zniknie w najbliższym czasie. Nawet dyrektor generalny OpenAI, Sam Altman, przyznał, że koszt AI stał się w tym roku „ogromnym problemem" dla klientów.
Jeśli to czytasz, jesteś już o krok do przodu. Pozostań tam dzięki naszemu newsletterowi.

