Отклучување на природниот разговор со ChatGPT Гласовен режим
ChatGPT на OpenAI ја револуционизираше интеракцијата помеѓу човекот и вештачката интелигенција, а неговиот Гласовен режим го носи ова чекор понатаму, нудејќи навистина природно и разговорно искуство. Оваа иновативна функција им овозможува на корисниците да се вклучат во говорни дијалози со ChatGPT, надминувајќи ги текстуалните барања кон поинтуитивна и динамична размена. Напојуван од природно мултимодални модели, Гласовниот режим ви овозможува да поставувате прашања, да навлегувате во дискусии и да добивате говорни одговори, правејќи ги вашите интеракции со вештачката интелигенција да изгледаат почовечки од кога било досега. Без разлика дали сте во движење со вашиот мобилен уред или работите од вашиот десктоп, Гласовниот режим е лесно достапен, трансформирајќи го начинот на кој ја користите вештачката интелигенција за информации, креативност и продуктивност.
Важно е да се признае дека, иако се високо напредни, овие модели на вештачка интелигенција повремено можат да прават грешки. OpenAI нагласува дека треба да се проверуваат важни информации добиени преку гласовни разговори, зајакнувајќи ја потребата за критичка оценка. Како што оваа технологија еволуира, пристапот и ограничувањата за употреба се предмет на промена, одразувајќи го континуираниот развој и подобрување на понудите за вештачка интелигенција од страна на OpenAI.
Поставување и користење на ChatGPT Гласовен режим низ платформи
Ангажирањето со ChatGPT преку глас е дизајнирано да биде беспрекорно, без разлика дали користите мобилна апликација или десктоп веб-интерфејс.
На мобилни уреди
За да започнете гласовен разговор на вашиот паметен телефон, едноставно отворете ја апликацијата ChatGPT и пронајдете ја иконата за Гласовен режим која се наоѓа во долниот десен агол на вашиот екран. Повеќето корисници на iOS и Android ќе искусат интегриран гласовен интерфејс директно на главната страница за разговор. Сепак, за време на објавувањето на ажурирањата, некои сметки може привремено да се префрлат на 'Одделен режим' (екран со сина сфера), кој може да се префрли во Settings → Voice → Separate Mode. Кога сте во гласовен разговор, иконата за микрофон ви овозможува да го исклучите или вклучите звукот, а иконата за излез го завршува разговорот. Вашиот прв гласовен разговор ќе ве поттикне да изберете глас и да дадете дозволи за микрофон на апликацијата, што е клучно за функционалноста.
На десктоп веб
Гласовните разговори се исто така целосно поддржани на десктоп веб-от преку ChatGPT.com. Овде, ќе ја најдете иконата за Гласовен режим на десната страна од прозорецот за внесување. Слично на искуството на мобилни уреди, корисниците кои првпат користат ќе треба да му дадат дозвола на својот прелистувач да пристапи до микрофонот на уредот и да изберат глас на вештачка интелигенција. Интерфејсот за исклучување и завршување на разговорите ја отсликува мобилната верзија, обезбедувајќи конзистентно корисничко искуство.
Подобрување на интеракцијата: Видео, споделување екран и прикачување фотографии
Покрај чист глас, Гласовниот режим на ChatGPT за претплатници на мобилни апликации ги проширува своите мултимодални способности за да вклучи визуелна интеракција. Овие функции значително ја збогатуваат длабочината на вашите разговори, овозможувајќи ѝ на вештачката интелигенција да го разбере и да одговори на визуелниот контекст.
Споделување видео: Претплатниците на iOS и Android можат да споделуваат видео во живо од нивните уреди за време на гласовен разговор со допирање на копчето за камера. Ова му овозможува на ChatGPT да обработува визуелни информации во реално време, овозможувајќи поконтекстуални и поинформирани одговори. Повторно допирање на копчето го прекинува споделувањето видео.
Прикачување фотографии и споделување екран: За споделување статични слики или екранот на вашиот уред, пристапете до менито со 'три точки'. Оттука, можете да изберете да направите нова фотографија, да прикачите постоечка од вашата галерија или да започнете споделување на екранот. Ова е особено корисно за дискутирање специфични документи, слики или демонстрирање проблеми на екранот директно со вештачката интелигенција.
Управување со визуелни споделувања: Откако споделувањето екран е активно, можете повторно да го допрете копчето за споделување екран за да го запрете. Ако споделувате надвор од апликацијата ChatGPT, индикаторот на системот на вашиот телефон (црвена точка на Apple, зелен микрофон на Android) ќе ви овозможи да го запрете споделувањето. Алтернативно, враќањето во апликацијата обезбедува директни контроли за да го запрете споделувањето или да го завршите целиот разговор.
Важно е да се забележи дека иако овие визуелни способности се моќни, тие се предмет на дневни и по-разговорни ограничувања за употреба за подобни планови. Откако ќе се достигне вашето дневно ограничување за користење на GPT-4o глас, ќе се префрлите на GPT-4o mini и привремено ќе ја изгубите можноста за споделување ново видео или екранска содржина додека не се ресетира вашето дневно ограничување за користење на GPT-4o.
Разбирање на можностите и ограничувањата за користење на Гласовниот режим
ChatGPT Гласовниот режим не е универзално искуство; неговите можности и достапност се прилагодени за различни нивоа на корисници и модели.
Достапни гласовни опции: OpenAI нуди избор од девет различни, живописни излезни гласови, секој дизајниран да понуди уникатно аудитивно искуство. Овие гласови обезбедуваат персонализирана и привлечна интеракција.
| Име на глас | Опис |
|---|---|
| Arbor | Лежерен и разновиден |
| Breeze | Анимиран и искрен |
| Cove | Компониран и директен |
| Ember | Сигурен и оптимистички |
| Juniper | Отворен и весел |
| Maple | Весел и искрен |
| Sol | Снаодлив и опуштен |
| Spruce | Мирен и потврден |
| Vale | Светол и испитувачки |
Можете да го промените избраниот глас во секое време преку поставките или преку менито за прилагодување во Гласовниот режим, иако промените обично важат за нови разговори.
Ограничувања за користење според планот: Времетраењето и можностите на вашите гласовни разговори значително се разликуваат врз основа на вашата претплата на ChatGPT:
- Претплатници: Уживајте во речиси неограничена дневна употреба само за аудио глас. Разговорите започнуваат со високо напредниот модел GPT-4o, а потоа се префрлаат на GPT-4o mini откако ќе се потрошат дневните минути на GPT-4o.
- Enterprise корисници (флексибилни цени): Имаат корист од неограничена употреба на GPT-4o глас, подложно на потрошувачка на кредити, што го прави идеален за потребите на организации со голем обем.
- Pro претплатници: Исто така имаат неограничена употреба на GPT-4o глас, со заштитни мерки против злоупотреба за да се обезбеди правична употреба.
- Најавени бесплатни корисници: Пристапуваат до ChatGPT глас напојуван од GPT-4o mini, подложно на одреден број часови дневно, со ограничувања кои може да се променат.
Способностите за видео и споделување екран исто така имаат свои дневни и по-разговорни ограничувања за подобни планови, типично поврзани со користењето на GPT-4o.
Оптимизирање на вашето искуство со разговорна вештачка интелигенција
За да се обезбедат најмазни и најефективни гласовни разговори, OpenAI нуди неколку совети и ги истакнува тековните специфики на функциите.
Разговори во заднина: Можете да овозможите "Разговори во заднина" во поставките, овозможувајќи вашиот гласовен разговор да продолжи дури и кога се префрлате на други апликации или го заклучувате екранот на телефонот. Ова го подобрува мултитаскингот и обезбедува континуитет, иако разговорите ќе завршат по еден час, ако апликацијата е насилно затворена, или ако се достигнат дневните лимити. Споделувањето екран во заднина исто така ќе престане под слични услови.
Спречување прекини: За оптимална јасност и за минимизирање на ненамерни прекини, користењето слушалки за време на гласовни разговори е многу препорачливо. Корисниците на iPhone можат дополнително да го подобрат ова со овозможување на режимот "Изолација на глас" за микрофонот во нивниот Контролен панел додека се во гласовен разговор. Доколку проблемите продолжат, едноставни чекори за отстранување проблеми, како што се рестартирање на апликацијата, прилагодување на јачината на звукот на асистентот или преместување во потивка средина, често можат да ги решат.
Гласовни разговори со GPTs: Гласовниот режим ја проширува својата функционалност на прилагодени GPTs, овозможувајќи ви да разговарате со нив користејќи ги нивните одредени гласовни опции, како што е 'Shimmer'. Сепак, клучно е да се забележат тековните ограничувања: Гласовниот режим сè уште не поддржува напредни алатки како генерирање слики, прикачување датотеки или Code Interpreter при интеракција со GPTs. Прилагодените акции во рамките на GPTs исто така не се достапни во овој режим, што укажува дека, иако е мултимодален, одредени напредни интеграции сè уште зависат од текст.
Точност на транскрипцијата: Природно мултимодалната природа на гласовните разговори значи директна аудио размена помеѓу вас и моделот. Следствено, иако се обезбедуваат транскрипции, тие можеби не секогаш совршено се усогласуваат со оригиналниот говорен разговор поради нијансите на природниот говор и толкувањето на вештачката интелигенција. Ова е област на постојано подобрување бидејќи моделите на вештачка интелигенција стануваат повешти во разбирањето и обработката на сложениот човечки јазик.
Гласовниот режим на OpenAI претставува значаен скок во скалирањето на вештачката интелигенција за сите, правејќи ги интеракциите со вештачката интелигенција подостапни и поприродни. Како што технологијата продолжува да еволуира, овие богати мултимодални можности ветуваат уште поинтегрирано и интуитивно корисничко искуство. Корисниците заинтересирани за продлабочување на своето разбирање на основните механизми на вештачката интелигенција може да најдат вредни увиди во најдобрите практики за дизајнирање барања со OpenAI API за сите форми на интеракција.
Оригинален извор
https://help.openai.com/en/articles/8400625-voice-mode-faqЧесто поставувани прашања
What is ChatGPT Voice Mode and how does it facilitate natural interaction?
How can I initiate a voice conversation with ChatGPT on both mobile and web platforms?
What are the various voice options available in ChatGPT Voice Mode, and how can I change them?
What are the usage limits for ChatGPT Voice Mode across different subscription plans and user types?
Can I share video, photos, or my screen during a ChatGPT voice conversation, and are there any specific limitations?
What strategies can I employ to prevent interruptions and optimize my voice conversations with ChatGPT?
Is ChatGPT's Voice Mode compatible with custom GPTs, and what are the current functional constraints?
Бидете информирани
Добивајте ги најновите AI вести на е-пошта.
