ChatGPT spája hlas s textom: Nová aktualizácia ukazuje, čo môžeme čakať od budúcej Siri

Keď bol ChatGPT spustený, fungoval výhradne na báze textu. Neskôr pridaný hlasový režim pôsobil skôr ako samostatná funkcia – používateľ si musel vybrať, či chce písať, alebo hovoriť. To bolo často frustrujúce, najmä ak ste chceli hlasom požiadať o vygenerovanie obrázka, čo si vyžadovalo návrat k textu.

Najnovšia aktualizácia túto bariéru rúca. Funkcia ChatGPT Voice je teraz dostupná priamo v chate. Môžete rozprávať, sledovať odpovede, ako sa objavujú na obrazovke, a prezerať si mapy či vizuály bez prerušenia konverzácie. Hoci systém má ešte svoje „muchy“ (občas tvrdí, že zobrazil mapu, hoci sa tak nestalo), ukazuje jasný smer vývoja.

Výzva pre Apple a novú Siri

Zatiaľ čo OpenAI integruje hlas do textového prostredia, Apple k tomu pristupuje z opačného konca. Siri začínala ako čisto hlasová služba a prostredníctvom Apple Intelligence sa teraz učí pracovať s textom a kontextom na obrazovke (napríklad sumarizácia e-mailov).

Aby nová Siri splnila sľuby, musí fungovať presne ako aktualizovaný ChatGPT – musí byť multimodálna. Nestačí len odpovedať hlasom; musí vedieť manipulovať s textom a obrázkami na základe hovoreného príkazu.

Siri ako inteligentný agent

Budúcnosť asistentov nespočíva len v konverzácii, ale v akciách. Siri bude musieť fungovať ako inteligentný agent, ktorý ovláda nainštalované aplikácie.

Príkladom je príkaz: „Zarezervuj prvý zajtrajší let z Londýna do Las Vegas.“ Asistent musí pochopiť kontext a vykonať akciu cez príslušnú cestovnú aplikáciu.

Bude technológia vlastná alebo požičaná?

Je otázne, či Apple dokáže dobehnúť náskok chatbotov vlastnými silami včas. Je pravdepodobné, že pre pokročilé funkcie AI siahne po spolupráci s firmami ako OpenAI alebo Google.

Pre koncového používateľa pritom nie je podstatné, či technológia pod kapotou patrí Applu. Dôležité sú dve veci:

Ochrana súkromia: Apple musí garantovať, že dáta odoslané partnerom (ako pri súčasnej integrácii ChatGPT) nebudú použité na tréning modelov.

Rýchlosť nasadenia: Budúci rok je hraničným termínom. Ak to znamená použitie upraveného modelu Gemini alebo GPT-4o integrovaného do Siri, používatelia to pravdepodobne radi prijmú výmenou za funkčnosť.

Roman Kováč
Vedúci redaktor - technológie

Jeho domácnosť pravdepodobne funguje úplne sama. Fascinuje ho automatizácia a testuje všetko – od robotických vysávačov, cez smart osvetlenie, až po inteligentné zásuvky. Okrem toho, že vám ukáže, ako si uľahčiť každodenný život, vďaka nemu presne zistíte, koľko elektriny váš nový spotrebič reálne spotrebuje. Ukazuje čitateľom, že smart domácnosť nemusí byť vôbec drahá ani zložitá.

Show Comments (0) Hide Comments (0)
Zanechajte komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *