
Firma Nvidia ujawniła we wtorek więcej szczegółów na temat swojej kolejnej platformy układów sztucznej inteligencji – Blackwell Ultra, która według firmy pomoże aplikacjom rozumować i działać w imieniu użytkowników.
Blackwell Ultra, którego szczegóły ogłoszono na corocznej konferencji GTC firmy, zbudowano w oparciu o istniejący, pożądany układ Blackwell firmy Nvidia. Firma poinformowała, że dodatkowa moc obliczeniowa w nowej wersji Ultra ułatwi modelom sztucznej inteligencji rozbijanie złożonych zapytań na wiele kroków i ocenę różnych opcji, czyli innymi słowy, rozumowanie.
Po wprowadzeniu na rynek ChatGPT firmy OpenAI w 2022 r. popyt na układy AI gwałtownie wzrósł, co spowodowało gwałtowny wzrost cen akcji firmy Nvidia. Jego układy scalone zasilają centra danych, które obsługują popularną, energochłonną sztuczną inteligencję i usługi w chmurze w takich firmach, jak Microsoft, Amazon i Google.
Jednak zdolność wnioskowania i rzekomo niski koszt DeepSeek, chińskiego startupu technologicznego, który zaszokował Wall Street modelem R1, doprowadziły do spekulacji, że do uruchamiania wydajnych modeli sztucznej inteligencji niekoniecznie jest potrzebny drogi sprzęt. Jednak Nvidia najwyraźniej przezwycięża te obawy, o czym świadczą wyniki finansowe za kwartał w styczniu, które przewyższyły oczekiwania Wall Street.
Nvidia chce, aby jej układy scalone stały się podstawą modeli rozumowania, które chiński startup technologiczny pomógł spopularyzować. Firma Nvidia twierdzi, że na zapytanie DeepSeek R1, na które w przypadku układu Hopper poprzedniej generacji odpowiedź zajmowała półtorej minuty, układ Blackwell Ultra będzie potrzebował zaledwie 10 sekund.
Nad nowymi serwerami opartymi na platformie Blackwell Ultra pracują m.in. firmy Cisco, Dell, HP, Lenovo i Supermicro. Oczekuje się, że pierwsze produkty z technologią Blackwell Ultra pojawią się w drugiej połowie 2025 roku.
Eksperci twierdzą, że możliwość wnioskowania i myślenia o odpowiedzi przed jej udzieleniem pozwoli aplikacjom i agentom AI radzić sobie z bardziej złożonymi i szczegółowymi typami pytań. Zamiast po prostu udzielać odpowiedzi, chatbot rozumujący potrafi przeanalizować pytanie i podać wiele szczegółowych odpowiedzi, uwzględniających różne scenariusze.
Firma Nvidia podała przykład wykorzystania modelu rozumowania do stworzenia planu rozmieszczenia gości na weselu, który uwzględnia preferencje, takie jak wybór miejsca dla rodziców i teściów lub posadzenie panny młodej po lewej stronie.
„Modele zaczynają teraz naśladować zachowania w pewnym stopniu przypominające ludzkie” – powiedział Arun Chandrasekaran, analityk zajmujący się sztuczną inteligencją w firmie badawczej Gartner.
DeepSeek i OpenAI nie są jedynymi programami tworzącymi modele, które potrafią rozumować. Pod koniec ubiegłego roku firma Google zaktualizowała również swoje modele Gemini, dodając do nich więcej możliwości rozumowania, a w lutym firma Anthropic wprowadziła hybrydowy model rozumowania o nazwie Claude 3.7 Sonnet.