Wiadomości ze świata AI – czerwiec 2025

Poniżej lista wiadomości z czerwca 2025 

Sam Altman oficjalnie potwierdza premierę GPT-5 latem 2025

Sam Altman, CEO OpenAI, po miesiącach spekulacji oficjalnie potwierdził w pierwszym odcinku firmowego podcastu OpenAI, że GPT-5 zostanie wydany “prawdopodobnie tego lata” 2025. To pierwsza tak konkretna zapowiedź od miesięcy niepewności. Nowy model ma oferować zunifikowaną multimodalność (płynne łączenie tekstu, obrazu i głosu), kontekst miliona tokenów umożliwiający analizę bardzo długich dokumentów oraz zaawansowane rozumowanie zbliżone do progu AGI. Model będzie trenowany na infrastrukturze Project Stargate o mocy gigawata. Altman podkreślił, że zespół OpenAI wciąż ustala, jak rewolucyjny powinien być nowy model pod względem numeracji, a na ile po prostu “coraz lepszy i lepszy”, podobnie jak w przypadku GPT-4o.

Meta przejmuje 49% udziałów w Scale AI za 14,3 mld dolarów

Meta przeprowadziła jedną z największych inwestycji w swojej historii technologicznej, przejmując 49% udziałów w Scale AI za 14,3 mld dolarów przy wycenie firmy na 29 mld dolarów. To druga największa transakcja w historii Meta po przejęciu WhatsApp za 19 mld dolarów. Alexandr Wang, 28-letni CEO Scale AI, dołączył do Meta, aby kierować nowym laboratorium “Meta Superintelligence Labs” (MSL), które ma dostarczyć “personalną superinteligencję dla każdego”. Do zespołu dołączyło również siedmiu byłych inżynierów OpenAI. Mark Zuckerberg w wewnętrznej notatce napisał: “Kiedy tempo postępu AI przyspiesza, rozwój superinteligencji staje się realny”.

Google wprowadza Gemini 2.5 Pro z Deep Think i Flash-Lite

Google zaktualizował serię modeli Gemini 2.5, wprowadzając stabilne wersje 2.5 Flash i Pro oraz nową wersję “Flash-Lite” zoptymalizowaną pod kątem szybkości i kosztów. Gemini 2.5 Flash-Lite to model myślący z najniższymi opóźnieniami i kosztami w rodzinie 2.5, oferujący lepszą wydajność w większości ocen. Model obsługuje wszystkie natywne narzędzia Google, w tym Grounding z Google Search, Code Execution i URL Context. Wprowadzono również eksperymentalny tryb Deep Think do zaawansowanego rozumowania w wersji Pro. Modele Gemini 2.5 to modele myślące, zdolne do przemyślenia swoich myśli przed odpowiedzią, co skutkuje lepszą wydajnością i dokładnością.

ChatGPT otrzymuje Record Mode dla użytkowników instytucjonalnych
OpenAI uruchomiło ChatGPT Record Mode dla użytkowników Pro, Enterprise i Education w aplikacji macOS, umożliwiając nagrywanie spotkań, sesji burzy mózgów i notatek głosowych bezpośrednio w interfejsie czatu. Funkcja automatycznie transkrybuje audio na żywo, wyodrębnia kluczowe punkty i może przekształcać je w działania następcze, elementy akcji, a nawet linie kodu. Po kliknięciu “Wyślij” generuje ustrukturyzowane podsumowanie sesji w canvas – prywatnej przestrzeni roboczej dołączonej do czatu. Nagrania audio są używane wyłącznie do celów transkrypcji i nie są przechowywane.

Midjourney wprowadza V1 Video Model z optymalizacją dla mediów społecznościowych
Midjourney wprowadziło swój pierwszy model do generowania wideo V1, pozwalający na tworzenie 5-sekundowych klipów z możliwością rozszerzenia do 21 sekund poprzez czterokrotne wydłużanie o 4 sekundy. Model typu image-to-video umożliwia użytkownikom przesyłanie obrazów lub używanie wygenerowanych przez inne modele Midjourney, a V1 produkuje zestaw czterech pięciosekundowych filmów na ich podstawie. Dostępne są dwie opcje animacji: automatyczne ustawienie animacji oraz funkcja ręcznej animacji, gdzie użytkownicy mogą opisywać określone działania i ruchy kamery. Firma wprowadzła również zoptymalizowany koder “Save for Social Media” w odpowiedzi na problemy z kompresją podczas przesyłania filmów na platformy społecznościowe.

Glean pozyskuje 150 mln dolarów przy wycenie 7,2 mld w rundzie Series F
Platforma enterprise AI agents Glean otrzymała finansowanie prowadzone przez Wellington Management, przekraczając 100 mln dolarów rocznego przychodu (ARR) i obsługując ponad 100 milionów działań agentów rocznie. To trzecia runda finansowania dla amerykańskiego startupu enterprise AI search w niecałe dwa lata, co oznacza wzrost wyceny o 57% w porównaniu z rundą z września (4,6 mld dolarów). Glean opracowuje platformę “Work AI”, która działa jako inteligentny asystent i wyszukiwarka przedsiębiorstwa, łącząc się z danymi wewnętrznymi firmy i rozumiejąc je. Firma została założona w 2019 roku przez zespół byłych inżynierów wyszukiwarek Google.

FDA wprowadza agencyjne narzędzie AI “Elsa” do optymalizacji wydajności
Amerykańska Agencja Żywności i Leków uruchomiła Elsa, pierwsze agencyjne narzędzie AI zaprojektowane do pomocy pracownikom – od recenzentów naukowych po inspektorów – w bardziej efektywnej pracy. Zbudowana w środowisku wysokiego bezpieczeństwa GovCloud, Elsa oferuje bezpieczną platformę dla pracowników FDA do dostępu do dokumentów wewnętrznych, zapewniając jednocześnie, że wszystkie informacje pozostają w agencji. Modele nie trenują na danych przesłanych przez regulowaną branżę, chroniąc wrażliwe badania i dane obsługiwane przez personel FDA. Elsa może podsumowywać zdarzenia niepożądane w celu wsparcia ocen profilu bezpieczeństwa, wykonywać szybsze porównania etykiet i generować kod, aby pomóc w opracowywaniu baz danych dla aplikacji nieklinicznych.

NVIDIA prezentuje przyszłość AI na GTC Paris w ramach VivaTech
Jensen Huang, CEO NVIDIA, wygłosił kluczowy keynote na VivaTech 2025 w Paryżu, przedstawiając następną fazę AI computing – od systemów agentowych do fabryk AI. W swojej prezentacji “Discover the platform powering the industrialization of intelligence” Huang podkreślił, że infrastruktura stała się teraz krzywą innowacji. Nowoczesne centra danych ewoluowały z przechowywania i serwowania danych do generowania tokenów – nowego surowca inteligencji. NVIDIA zapowiedziało Grace Blackwell – najbardziej zaawansowany system AI firmy, przełomy w obliczeniach kwantowych, bliźniakach cyfrowych i robotyce humanoidalnej.

MiniMax M1 – nowy open source model z kontekstem 1M tokenów
Chiński startup MiniMax wprowadził model M1 na licencji Apache 2.0 z kontekstem 1 miliona tokenów wejściowych i 80 000 tokenów wyjściowych, ustanawiając nowe standardy w długokontekstowym rozumowaniu, użyciu narzędzi agentowych i wydajnej wydajności obliczeniowej. Model wyróżnia się architekturą hybrydowego Mixture-of-Experts (MoE) i zoptymalizowanym mechanizmem “lightning attention”, który redukuje obciążenie obliczeniowe. M1 zużywa tylko 25% FLOPs wymaganych przez DeepSeek R1 przy generowaniu 100 000 tokenów. Model został wytrenowany za jedynie 534 700 dolarów, co stanowi ułamek kosztów konkurentów.

Anthropic wprowadza Claude Artifacts dla tworzenia aplikacji
Claude otrzymał funkcję Artifacts umożliwiającą tworzenie interaktywnych aplikacji bez konieczności programowania i hostingu. Ta funkcja pozwala użytkownikom na szybkie prototypowanie i tworzenie funkcjonalnych aplikacji web poprzez naturalne instrukcje tekstowe. Artifacts reprezentuje znaczący krok w kierunku przekształcenia Claude’a z narzędzia konwersacyjnego w platformę do tworzenia aplikacji. Użytkownicy mogą tworzyć dashboardy, kalkulatory, gry i inne interaktywne elementy, które są natychmiast dostępne i funkcjonalne. System automatycznie generuje kod, stylizację i logikę aplikacji na podstawie opisów użytkownika, znacznie obniżając barierę wejścia dla osób bez doświadczenia programistycznego.

WormGPT powraca z niebezpiecznymi wariantami AI
Badacze cyberbezpieczeństwa odkryli nowe złośliwe warianty AI oparte na modelach Grok i Mixtral, używane do automatyzacji phishingu i tworzenia malware. Te “jailbroken” modele AI zostały specjalnie zmodyfikowane, aby omijać zabezpieczenia etyczne i generować szkodliwe treści. WormGPT, który pierwotnie pojawił się jako złośliwa wersja GPT, ewoluował w bardziej wyrafinowaną platformę wykorzystującą najnowsze modele open-source. Nowe warianty mogą generować przekonujące e-maile phishingowe, tworzyć kod malware i automatyzować ataki socjotechniczne na niespotykaną wcześniej skalę. Eksperci ostrzegają, że dostępność potężnych modeli open-source ułatwia cyberprzestępcom tworzenie dostosowanych narzędzi AI do szkodliwych celów.

Project Mariner – Google AI przejmuje kontrolę nad przeglądarką
Google oficjalnie zaprezentował Project Mariner w ramach demonstracji na VivaTech 2025, wtyczkę do Chrome umożliwiającą AI wykonywanie zadań w przeglądarce na podstawie instrukcji tekstowych. System może nawigować po stronach internetowych, wypełniać formularze, klikać linki i wykonywać złożone sekwencje działań w imieniu użytkownika. Project Mariner wykorzystuje multimodalną sztuczną inteligencję do rozumienia zawartości wizualnej stron web oraz podejmowania odpowiednich działań. Technologia integruje się z ekosystemem Google Workspace, umożliwiając automatyzację rutynowych zadań biznesowych. Demonstracje obejmowały automatyczne rezerwacje, wypełnianie wniosków online i przeprowadzanie badań konkurencyjnych.

Tesla planuje pierwszą w historii autonomiczną dostawę pojazdu
Tesla ogłosiła przełomową demonstrację autonomicznej jazdy – 28 czerwca 2025 roku w Austin, Model Y ma samodzielnie pojechać bezpośrednio z fabryki do klienta bez interwencji ludzkiej. To będzie pierwsza na świecie komercyjna dostawa pojazdu w pełni autonomicznego. Pojazd będzie wyposażony w najnowszą wersję oprogramowania Full Self-Driving (FSD) v12.5 oraz sprzęt Hardware 4.0. Trasa o długości około 50 kilometrów będzie monitorowana przez zespoły bezpieczeństwa, ale pojazd ma poruszać się całkowicie autonomicznie. Tesla planuje transmisję na żywo całego procesu, demonstrując zaawansowanie swojej technologii autonomicznej jazdy.

ChatGPT integruje się z Google Drive i Microsoft 365
OpenAI wprowadza konektory enterprise umożliwiające ChatGPT bezproblemowy dostęp do danych z Google Drive, Gmail, Outlook, Microsoft Teams i innych popularnych platform biznesowych. Integracja pozwala użytkownikom na analizowanie dokumentów, generowanie raportów i automatyzację przepływów pracy bez konieczności ręcznego przesyłania plików. System respektuje uprawnienia użytkowników i nie uzyskuje dostępu do danych, do których użytkownik nie ma autoryzacji. Funkcja jest dostępna dla planów Enterprise i Education, z pełnym szyfrowaniem end-to-end i audytowalnym dostępem do danych. Konektory obsługują ponad 100 różnych formatów plików i integrują się z systemami zarządzania danymi przedsiębiorstwa.

Automatica 2025 – rekordowe targi robotyki w Monachium
Targi automatica 2025 w Monachium przyciągnęły rekordowe 47 500 odwiedzających i 800 wystawców, prezentując 1120 robotów w sześciu halach wystawienniczych. To największe wydarzenie w branży robotyki i automatyzacji w Europie, które po raz pierwszy w historii przekroczyło próg 40 000 uczestników. Główne tematy targów obejmowały roboty humanoidalne, systemy AI-napędzane oraz integrację robotyki z IoT. Prezentowane były najnowsze rozwiązania w zakresie robotyki przemysłowej, robotów serwisowych i współpracujących robotów (cobotów). Szczególną uwagę przyciągnęły demonstracje robotów zdolnych do uczenia się poprzez obserwację oraz systemy wykorzystujące wizję komputerową do precyzyjnej manipulacji obiektami.

Neurologica – AI wykrywająca udar przed wystąpieniem objawów
Hiszpańska firma technologii medycznych Neurologica opracowała przełomowy algorytm AI analizujący mikroruchy twarzy i rozszerzenia źrenic, który potrafi wykryć nadchodzący udar wcześniej niż doświadczony lekarz. System wykorzystuje kamery wysokiej rozdzielczości i zaawansowane algorytmy wizji komputerowej do monitorowania subtelnych zmian w mimice twarzy i reakcjach źrenic, które poprzedzają wystąpienie udaru nawet o kilka godzin. Technologia została przetestowana w szpitalach w Madrycie i Barcelonie, osiągając 94% dokładność w przewidywaniu udarów niedokrwiennych. System może być zintegrowany z istniejącymi kamerami monitoringu szpitalnego, automatycznie alarmując personel medyczny o pacjentach wysokiego ryzyka. Neurologica planuje komercjalizację technologii w drugiej połowie 2025 roku, po uzyskaniu certyfikacji CE dla urządzeń medycznych.

Project Vend – eksperyment z autonomicznym sklepem Claude
Anthropic przeprowadziło fascynujący eksperyment, w którym AI Claude (nazwany Claudius) przez miesiąc samodzielnie prowadził sklep spożywczy w biurze firmy w San Francisco. Eksperyment miał na celu przetestowanie zdolności AI do podejmowania decyzji biznesowych w rzeczywistych warunkach. Claude zarządzał zapasami, ustalał ceny, obsługiwał transakcje i nawet prowadził negocjacje z dostawcami za pośrednictwem interfejsów cyfrowych. Wyniki były mieszane – AI skutecznie optymalizował rotację zapasów i zwiększył przychody o 23%, ale miał problemy z niektórymi aspektami obsługi klienta i czasami podejmował “kreatywne” decyzje cenowe. Eksperyment dostarczył cennych danych na temat ograniczeń i możliwości autonomicznych systemów AI w kontekście rzeczywistych zastosowań biznesowych.

Roboty Unitree w zastosowaniach medycznych
Chińska firma Unitree rozpoczęła pionierskie testy swoich robotów humanoidalnych w środowisku szpitalnym, gdzie maszyny sterowane zdalnie wykonują podstawowe procedury medyczne. Roboty H1 zostały wyposażone w precyzyjne manipulatory i systemy wizyjne, pozwalające im na asystowanie przy zabiegach chirurgicznych, dystrybucję leków i monitorowanie pacjentów. Pierwsze testy odbyły się w szpitalu uniwersyteckim w Szanghaju, gdzie roboty pomogły w ponad 200 procedurach medycznych. Szczególnie skuteczne okazały się w zadaniach wymagających precyzji i powtarzalności, takich jak przygotowywanie próbek laboratoryjnych i organizowanie sprzętu medycznego. System teleopercji pozwala doświadczonym lekarzom na kontrolowanie robotów z odległości, co może być szczególnie cenne w sytuacjach wysokiego ryzyka infekcyjnego.

AI & MEDTECH CEE 2025 – cyfrowa rewolucja w zdrowiu
Konferencja AI & MEDTECH CEE 2025 w Warszawie zgromadziła ponad 2000 uczestników z regionu Europy Środkowo-Wschodniej, skupiając się na zastosowaniu sztucznej inteligencji i big data w medycynie. Wydarzenie otrzymało patronat Ministerstwa Cyfryzacji i Ministerstwa Zdrowia. Główne tematy obejmowały diagnostykę opartą na AI, telemedicynę, robotykę medyczną i etyczne aspekty wykorzystania AI w ochronie zdrowia. Prezentowane były przypadki wdrożeń AI w polskich szpitalach, w tym systemy automatycznego rozpoznawania obrazów radiologicznych i platformy predykcyjnej analityki medycznej. Konferencja podkreśliła potencjał regionu CEE jako centrum innowacji w medtech, z rosnącą liczbą startupów rozwijających rozwiązania AI dla sektora zdrowotnego.

Hixfield – rewolucja w tworzeniu teledysków muzycznych
Nowe narzędzie AI o nazwie Hixfield potrafi zamienić statyczne zdjęcie w dynamiczny efekt specjalny przypominający kinowe ujęcia z profesjonalnych teledysków muzycznych. Technologia wykorzystuje zaawansowane algorytmy generacji wideo i analizy ruchu, aby utworzyć płynne, synchroniczne z muzyką sekwencje wizualne. System może analizować tempo, rytm i nastrój utworu muzycznego, automatycznie dostosowując ruchy kamery, efekty świetlne i przejścia między scenami. Hixfield został już wykorzystany przez kilku artystów niezależnych do tworzenia teledysków w budżecie nieprzekraczającym 1000 dolarów, podczas gdy tradycyjna produkcja kosztowałaby dziesiątki tysięcy. Narzędzie oferuje różne style wizualne, od minimalistycznych animacji po spektakularne efekty science fiction.

QNAP Edge AI przyspiesza wdrażanie sztucznej inteligencji
QNAP ogłosiło premierę Edge AI Storage Server – kompleksowej platformy edge computing integrującej przechowywanie danych, wirtualizację i akcelerację GPU w jednym rozwiązaniu. Platforma została zaprojektowana specjalnie dla przedsiębiorstw, które chcą wdrożyć AI w środowisku edge, gdzie wymagana jest minimalna latencja i lokalne przetwarzanie danych. System obsługuje popularne frameworki AI, w tym TensorFlow, PyTorch i ONNX, umożliwiając łatwe wdrażanie gotowych modeli lub trenowanie własnych. Zintegrowane GPU zapewniają znaczną moc obliczeniową dla zadań inferencji AI, podczas gdy system magazynowania obsługuje duże zestawy danych treningowych. QNAP Edge AI szczególnie nadaje się dla aplikacji takich jak analiza wideo w czasie rzeczywistym, predykcyjna konserwacja przemysłowa i inteligentne systemy monitoringu.

Microsoft AI przewyższa lekarzy w diagnostyce medycznej
Microsoft Research opublikował wyniki przełomowego badania pokazującego, że ich nowe narzędzie AI do diagnostyki medycznej przewyższa doświadczonych lekarzy w diagnozowaniu skomplikowanych przypadków medycznych, będąc jednocześnie znacznie tańszym w eksploatacji. System, nazwany Microsoft AI Diagnostic Orchestrator (MAI-DxO), analizuje wyniki badań laboratoryjnych, obrazowanie medyczne, historię choroby i objawy kliniczne, aby zaproponować precyzyjne diagnozy. W testach przeprowadzonych na 304 przypadkach z New England Journal of Medicine, AI osiągnął 85,5% dokładność w diagnozowaniu skomplikowanych przypadków, podczas gdy zespoły 21 doświadczonych lekarzy z USA i Wielkiej Brytanii osiągnęły średnio 20% dokładności. System może znacząco skrócić czas diagnostyki z tygodni do godzin, szczególnie w przypadkach wymagających analizy wielu specjalistów.

Konferencja “Horyzonty AI a cyberbezpieczeństwo”
Ogólnopolska konferencja naukowa “Horyzonty AI a cyberbezpieczeństwo” zorganizowana przez Akademię WSB w Dąbrowie Górniczej pod patronatem Ministerstwa Cyfryzacji zgromadziła ekspertów z zakresu bezpieczeństwa cybernetycznego i sztucznej inteligencji. Wydarzenie skupiło się na dwukierunkowej relacji między AI a cyberbezpieczeństwem – zarówno jako narzędziu obrony, jak i potencjalnym wektorze ataków. Prezentowane były najnowsze badania nad wykorzystaniem uczenia maszynowego do wykrywania zagrożeń cybernetycznych, automatyzacji odpowiedzi na incydenty i predykcyjnej analizy bezpieczeństwa. Równocześnie omawiano rosnące zagrożenia związane z wykorzystaniem AI przez cyberprzestępców, w tym deepfake’i, automatyzację ataków i AI-driven social engineering. Konferencja podkreśliła pilną potrzebę rozwoju regulacji prawnych i standardów etycznych dla zastosowań AI w kontekście bezpieczeństwa narodowego.

Gemini 2.5 Pro dominuje w rankingach LLM użytkowników
W czerwcu 2025 roku Gemini 2.5 Pro został najlepiej ocenianym przez ponad 2 miliony użytkowników modelem językowym w rankingach społecznościowych, przejmując prowadzenie od Grok 3 i wyprzedzając GPT-4o. Model uzyskał średnią ocenę 4.7/5 w kategoriach jakości odpowiedzi, kreatywności i przydatności praktycznej. Szczególnie wysokie oceny otrzymał za zdolności rozumowania matematycznego, analizę kodu i generowanie długich, spójnych tekstów. Użytkownicy docenili również funkcję Deep Think, która pozwala na bardziej przemyślane odpowiedzi w złożonych zagadnieniach. Sukces Gemini 2.5 Pro pokazuje rosnącą konkurencyjność Google w wyścigu LLM i może sygnalizować przesunięcie preferencji użytkowników w kierunku modeli oferujących lepszą równowagę między wydajnością a dostępnością.