Google I/O 2025. Nowa era Gemini pod znakiem Flow, awatarów 3D i agentów AI

dailyweb.pl 5 godzin temu
Zdjęcie: Google I/O 2025


Google I/O 2025 trwało prawie 2 godziny. To całkiem sporo czasu, aby przekazać wiele cennych informacji. Czy faktycznie czeka nas zapowiadana rewolucja AI?

Google I/O 2025 z jednej strony nie zaskoczyło, a z drugiej dało nam naprawdę ogrom różnych informacji. Do przewidzenia było, iż firma zaprezentuje szereg innowacji, związanych z Gemini, ale trzeba przyznać, iż w ciągu tych dwóch godzin otrzymaliśmy naprawdę ogrom informacji. To nowe opcje w samej wyszukiwarce, ale również kolejne, profesjonalne narzędzia, dzięki którym wygenerujemy filmy, a choćby ubierzemy się nie wchodząc do sklepu. Zaprezentowano również okulary Android XR.

Google I/O 2025 zaskoczyło liczbą nowych innowacji

To, iż Google rozwija Gemini nie jest żadnym zaskoczeniem. Z aplikacji korzysta 400 milionów aktywnych użytkowników miesięcznie. Co więcej – z modelu 2.5 Pro korzysta o 45% userów więcej. Gemini 2.5 Flash staje się teraz domyślnym modelem, a wariant 2.5 Pro uzyskuje wsparcie Deep Think – eksperymentalnego, ulepszonego trybu rozumowania przeznaczonego do wysoce złożonych obliczeń matematycznych i kodowania. Najciekawsze możliwości w kontekście AI dla zwykłych użytkowników dotyczą wyszukiwarki Google, ale również nowych możliwości podczas spotkań online i większą integracje z narzędziami generowania wideo i zdjęć.

Google Meet bez barier językowych i futurystyczny Google Beam

Ciekawie zapowiada się nowa możliwość podczas rozmów poprzez Google Meet. Funkcja Google Vids będzie tłumaczyła mowę w czasie niemal rzeczywistym i z niskim opóźnieniem w ponad 40 językach. To dosłownie – porozumiewanie się bez barier. Opcja jest dostępna na razie w języku angielskim i hiszpańskim, ale sukcesywnie będą dodawana kolejne. https://youtu.be/hyXqcsWOONo Google Beam, która ma zadebiutować jeszcze w tym roku, zamieni nasz pokój w futurystyczny film Sci-fi. System będzie przekształcać standardowe strumienie wideo 2D w realistyczne awatary 3D, umożliwiając łączenie się w bardziej naturalny i intuicyjny sposób. To wyparcie Projectu Starline i kooperacja z HP, aby dać użytkownikom coś naprawdę przełomowego. To nieco przerażające, ale jednocześnie intrygujące technologicznie. https://youtu.be/OTObIPmDyjc

Agenci AI na wyciągnięcie ręki

Wyszukiwarka Google uzyska opcje AI Mode, co jest rozszerzeniem standardowej wyszukiwarki o rozmowę z chatbotem na podobnej zasadzie, jak działa ChatGPT lub Gemini. To nie tylko wersja tekstowa. Project Astra pozwoli również na pokazanie w kamerze przedmiotu, aby system w sposób bardziej precyzyjny znalazł odpowiedzi na nasze zapytania. Uzyskamy interaktywne odpowiedzi na żywo, co może być pomocne przy – chociażby – naprawach sprzętów. Google wprowadza również agentów AI. Łączą oni inteligencję zaawansowanych modeli AI z dostępem do narzędzi, dzięki czemu mogą podejmować działania w imieniu i pod kontrolą użytkowników. Mnie szczególnie zaintrygowały wirtualne przymierzalnie poprzez funkcje Try It On. Kupując przez internet odzież możemy wprowadzić nasze wymiary, wgrać zdjęcie naszej sylwetki i sprawdzić, czy np. nowa sukienka w danym rozmiarze i kolorze będzie do nas pasować. [video width="1080" height="1080" mp4="https://alfred.dailyweb.pl/wp-content/uploads/2025/05/Try_it_on_Title_page_5.mp4"][/video] Zakupy w nowej formie przy wsparciu agentów AI pomogą nam również znaleźć przedmioty w określonej przez nas cenie i przeprowadzą przez kolejne etapy sprzedaży – aż do sfinalizowania transakcji. Project Mariner to wykonywanie aż do 10 zadań jednocześnie i obejmuje jeszcze m.in. dokonywanie rezerwacji na bilety.

Poczuj Flow tworząc filmy dzięki subskrypcji AI Ultra

Lista nowych funkcji, jakie zostały pokazane na konferencji, nie ma końca. Google przedstawił również najnowsze modele generatywnej AI, które stanowią znaczący przełom w tworzeniu multimediów. Veo 3, najnowocześniejszy model generowania wideo, nie tylko rozwija możliwości Veo 2, ale po raz pierwszy może również tworzyć filmy z dźwiękiem. https://youtu.be/A0VttaLy4sU Nowe narzędzie Flow to spora konkurencja dla Sory od OpenAI. Pozwala na płynne tworzenie klipów filmowych, scen i historii, łącząc najbardziej zaawansowane modele Google DeepMind: Veo, Imagen i Gemini. Oczywiście to już opcja dostępna tylko dla płatnych planów. Google wprowadza nową subskrypcje AI Ultra, kosztującą 249,99 USD miesięcznie.

Okulary z systemem Android XR

Firma wspomniała również o okularach, wspieranych przez system Android XR. To pierwsza platforma Android, zbudowana w erze Gemini, która zasila ekosystem zestawów słuchawkowych, okularów i wszystkiego pomiędzy. https://dailyweb.pl/google-zmienia-swoja-ikone-czy-to-poczatek-wiekszych-zmian/ To pomoc w codziennym użytkowaniu, dzięki wsparciu AI bez konieczności używania rąk. Wszystkie czynności wykonamy dzięki wzroku i poleceń głosowych. Google pracuje nad tą technologią od ponad 10 lat i cały czas wdraża kolejne pomysły, jak np. tłumaczenie na żywo między dwoma osobami z okularami. Kiedy nowy produkt pojawi się na rynku? Nie wiadomo, ale to niezwykle intrygująca koncepcja. Wszystkie nowości pokazane na znajdziecie również na oficjalnym blogu Google.
Idź do oryginalnego materiału