Otključavanje prirodnog razgovora s ChatGPT glasovnim načinom
ChatGPT tvrtke OpenAI revolucionirao je interakciju između ljudi i UI, a njegov glasovni način ide korak dalje, nudeći zaista prirodno i konverzacijsko iskustvo. Ova inovativna značajka omogućuje korisnicima vođenje govornih dijaloga s ChatGPT-om, prelazeći s tekstualnih upita na intuitivniju i dinamičniju razmjenu. Pokreću ga izvorno multimodalni modeli, glasovni način omogućuje vam postavljanje pitanja, upuštanje u rasprave i primanje govornih odgovora, čineći vaše interakcije s UI ljudskijima nego ikad prije. Bilo da ste u pokretu s mobilnim uređajem ili radite s računala, glasovni način je lako dostupan, transformirajući način na koji koristite UI za informacije, kreativnost i produktivnost.
Važno je priznati da, iako vrlo napredni, ovi UI modeli povremeno mogu pogriješiti. OpenAI naglašava provjeru važnih informacija dobivenih putem glasovnih razgovora, pojačavajući potrebu za kritičkom procjenom. Kako se ova tehnologija razvija, pristup i ograničenja korištenja podložni su promjenama, odražavajući kontinuirani razvoj i usavršavanje ponude UI tvrtke OpenAI.
Postavljanje i korištenje ChatGPT glasovnog načina na svim platformama
Korištenje ChatGPT-a putem glasa osmišljeno je da bude besprijekorno, bez obzira koristite li mobilnu aplikaciju ili desktop web sučelje.
Na mobilnim uređajima
Da biste započeli glasovni razgovor na svom pametnom telefonu, jednostavno otvorite aplikaciju ChatGPT i pronađite ikonu Glas smještenu u donjem desnom kutu zaslona. Većina korisnika na iOS-u i Androidu doživjet će integrirano glasovno sučelje izravno unutar glavne stranice za chat. Međutim, tijekom uvođenja ažuriranja, neki računi mogu privremeno zadano prebaciti na 'Odvojeni način' (zaslon s plavom kuglom), što se može promijeniti u Postavke → Glas → Odvojeni način. Kada ste u glasovnom chatu, ikona mikrofona omogućuje vam isključivanje ili uključivanje zvuka, a ikona izlaza završava razgovor. Vaš prvi glasovni chat tražit će od vas da odaberete glas i dodijelite aplikaciji dopuštenja za mikrofon, što je ključno za funkcionalnost.
Na stolnom webu
Glasovni razgovori također su u potpunosti podržani na stolnom webu putem ChatGPT.com. Ovdje ćete pronaći ikonu Glas na desnoj strani prozora za upit. Slično mobilnom iskustvu, korisnici koji prvi put koriste morat će svom pregledniku dati dopuštenje za pristup mikrofonu uređaja i odabrati glas UI. Sučelje za isključivanje zvuka i završavanje razgovora odražava mobilnu verziju, osiguravajući dosljedno korisničko iskustvo.
Poboljšanje interakcije: video, dijeljenje zaslona i prijenos fotografija
Osim čistog glasa, ChatGPT-ov glasovni način za pretplatnike na mobilnim aplikacijama proširuje svoje multimodalne mogućnosti kako bi uključio vizualnu interakciju. Ove značajke značajno obogaćuju dubinu vaših razgovora, omogućujući UI da razumije i odgovori na vizualni kontekst.
Dijeljenje videa
Pretplatnici na iOS-u i Androidu mogu dijeliti video uživo sa svojih uređaja tijekom glasovnog chata dodirom gumba kamere. To omogućuje ChatGPT-u obradu vizualnih informacija u stvarnom vremenu, omogućujući kontekstualnije i informiranije odgovore. Ponovni dodir gumba zaustavlja dijeljenje videa.
Prijenos fotografija i dijeljenje zaslona
Za dijeljenje statičnih slika ili zaslona vašeg uređaja, pristupite izborniku 'tri točkice'. Odavde možete odabrati snimanje nove fotografije, prijenos postojeće iz vaše galerije ili pokretanje dijeljenja zaslona. Ovo je posebno korisno za raspravljanje o određenim dokumentima, slikama ili demonstriranje problema na zaslonu izravno s UI.
Upravljanje vizualnim dijeljenjem
Nakon što je dijeljenje zaslona aktivno, možete ponovno dodirnuti gumb za dijeljenje zaslona da biste ga zaustavili. Ako dijelite izvan aplikacije ChatGPT, indikator sustava vašeg telefona (crvena točka na Appleu, zeleni mikrofon na Androidu) omogućit će vam da zaustavite dijeljenje. Alternativno, povratak u aplikaciju pruža izravne kontrole za zaustavljanje dijeljenja ili završetak cijelog razgovora.
Važno je napomenuti da iako su ove vizualne mogućnosti moćne, podložne su dnevnim ograničenjima korištenja i ograničenjima po razgovoru za prihvatljive planove. Nakon što se dosegnu vaša dnevna ograničenja korištenja GPT-4o, vratit ćete se na GPT-4o mini i privremeno izgubiti mogućnost dijeljenja novog video ili zaslonskog sadržaja dok se vaše dnevno ograničenje korištenja GPT-4o ne resetira.
Razumijevanje mogućnosti i ograničenja korištenja glasovnog načina
ChatGPT glasovni način nije univerzalno iskustvo; njegove mogućnosti i dostupnost prilagođene su različitim korisničkim razinama i modelima.
Dostupne opcije glasa:
OpenAI nudi izbor od devet različitih, realističnih izlaznih glasova, od kojih je svaki dizajniran da ponudi jedinstveno slušno iskustvo. Ovi glasovi osiguravaju personaliziranu i angažirajuću interakciju.
| Voice Name | Description |
|---|---|
| Arbor | Opušten i svestran |
| Breeze | Animiran i iskren |
| Cove | Staložen i izravan |
| Ember | Samouvjeren i optimističan |
| Juniper | Otvoren i veseo |
| Maple | Vedar i iskren |
| Sol | Iskusan i opušten |
| Spruce | Smiren i potvrdan |
| Vale | Svijetao i znatiželjan |
Svoj odabrani glas možete promijeniti u bilo kojem trenutku putem postavki ili unutar izbornika prilagodbe u glasovnom načinu, iako se promjene obično primjenjuju na nove razgovore.
Ograničenja korištenja prema planu:
Trajanje i mogućnosti vaših glasovnih razgovora značajno se razlikuju ovisno o vašoj pretplati na ChatGPT:
- Pretplatnici: Uživaju u gotovo neograničenoj dnevnoj upotrebi glasa samo za audio. Razgovori počinju s vrlo naprednim GPT-4o modelom, a zatim prelaze na GPT-4o mini nakon što se iscrpe dnevne minute GPT-4o.
- Korisnici poduzeća (fleksibilno cjenovno): Koriste neograničeno korištenje GPT-4o glasa, podložno potrošnji kredita, što ga čini idealnim za organizacijske potrebe velikog volumena.
- Pro pretplatnici: Također imaju neograničeno korištenje GPT-4o glasa, s mehanizmima zaštite od zlouporabe kako bi se osigurala poštena upotreba.
- Prijavljeni besplatni korisnici: Pristupaju ChatGPT glasu pokretanom GPT-4o mini, podložno određenom broju sati dnevno, s ograničenjima koja se mogu mijenjati.
Mogućnosti videa i dijeljenja zaslona također imaju vlastita dnevna ograničenja i ograničenja po razgovoru za prihvatljive planove, obično vezana uz korištenje GPT-4o.
Optimiziranje vašeg iskustva s konverzacijskom UI
Kako bi se osigurali najglađi i najučinkovitiji glasovni razgovori, OpenAI nudi nekoliko savjeta i naglašava trenutne specifičnosti značajki.
Pozadinski razgovori
Možete omogućiti 'Pozadinske razgovore' u postavkama, dopuštajući vašem glasovnom chatu da se nastavi čak i kada pređete na druge aplikacije ili zaključate zaslon telefona. To poboljšava višezadaćnost i osigurava kontinuitet, iako će se razgovori prekinuti nakon sat vremena, ako se aplikacija prisilno zatvori ili ako se dosegnu dnevna ograničenja. Dijeljenje zaslona u pozadini također će prestati pod sličnim uvjetima.
Sprečavanje prekida
Za optimalnu jasnoću i minimiziranje nenamjernih prekida, toplo se preporučuje korištenje slušalica tijekom glasovnih razgovora. Korisnici iPhonea mogu to dodatno poboljšati omogućavanjem načina mikrofona 'Izolacija glasa' u svom Kontrolnom centru dok su u glasovnom chatu. Ako problemi potraju, jednostavni koraci za rješavanje problema poput ponovnog pokretanja aplikacije, podešavanja glasnoće pomoćnika ili preseljenja u tiše okruženje često ih mogu riješiti.
Glasovni razgovori s GPT-ovima
Glasovni način proširuje svoju funkcionalnost na prilagođene GPT-ove, omogućujući vam razgovor s njima koristeći njihove dodijeljene opcije glasa, kao što je 'Shimmer'. Međutim, ključno je napomenuti trenutna ograničenja: glasovni način još ne podržava napredne alate poput generiranja slika, prijenosa datoteka ili Code Interpretera pri interakciji s GPT-ovima. Prilagođene akcije unutar GPT-ova također nisu dostupne u ovom načinu rada, što ukazuje da, iako je multimodalno, određene napredne integracije još uvijek ovise o tekstu.
Točnost transkripcije
Suštinski multimodalna priroda glasovnih razgovora znači izravnu audio razmjenu između vas i modela. Posljedično, iako su transkripcije pružene, one se možda neće uvijek savršeno podudarati s izvornim govornim razgovorom zbog nijansi prirodnog govora i interpretacije UI. Ovo je područje kontinuiranog poboljšanja kako UI modeli postaju vještiji u razumijevanju i obradi složenog ljudskog jezika.
OpenAI-ov glasovni način predstavlja značajan iskorak u skaliranju UI za sve, čineći interakcije s UI pristupačnijim i prirodnijim. Kako se tehnologija nastavlja razvijati, ove bogate multimodalne mogućnosti obećavaju još integriranije i intuitivnije korisničko iskustvo. Korisnicima zainteresiranima za produbljivanje razumijevanja temeljnih mehanizama UI mogle bi biti korisne spoznaje o najboljim praksama za inženjering upita s OpenAI API-jem za sve oblike interakcije.
Često postavljana pitanja
What is ChatGPT Voice Mode and how does it facilitate natural interaction?
How can I initiate a voice conversation with ChatGPT on both mobile and web platforms?
What are the various voice options available in ChatGPT Voice Mode, and how can I change them?
What are the usage limits for ChatGPT Voice Mode across different subscription plans and user types?
Can I share video, photos, or my screen during a ChatGPT voice conversation, and are there any specific limitations?
What strategies can I employ to prevent interruptions and optimize my voice conversations with ChatGPT?
Is ChatGPT's Voice Mode compatible with custom GPTs, and what are the current functional constraints?
Budite u toku
Primajte najnovije AI vijesti na e-mail.
