OpenAI het die alfa-vrystelling van die ChatGPT se gevorderde stemmodus, aangedryf deurinnoverende GPT-4o-model. Hierdie revolusionêre kenmerk, wat beloof om te lewer hiper-realistiese klankreaksies, sal aanvanklik vanaf vandag toeganklik wees vir 'n klein groepie ChatGPT Plus-gebruikers, met die doel om beskikbaarheid na alle Plus-intekenare uit te brei teen herfs 2024.
Stemmodus: ChatGPT se stemmodus is amptelik
Die aanbieding van die stemmodus met GPT-4o, wat in Mei plaasgevind het, het groot belangstelling en bewondering onder die publiek gewek, danksy die buitengewone generasiespoed en die treffende ooreenkoms met 'n regte menslike stem, wat vergelykings met dié van die bekende aktrise Scarlett Johansson ontlok het.
OpenAI het ontken dat hy die aktrise se stem gebruik het, het die stem daarna uit die demonstrasie verwyder en in Junie aangekondig dat 'n stel die vrystelling van gevorderde stemmodus uit veiligheidsmaatreëls te verbeter.
In hierdie alfafase sal sommige van die kenmerke wat tydens die lente-opdatering gewys word, soos video- en skermdeling, nie ingesluit word nie en sal op 'n later tydstip bekendgestel word. A geselekteerde groep premium gebruikers sal toegang hê tot die ChatGPT-stemfunksie wat in die demonstrasie aangebied word.
Lees ook: SearchGPT: wat die OpenAI-soekenjin is en hoe dit werk
Die Advanced Voice-modus verskil van die klankoplossing wat tans deur ChatGPT aangebied word, wat op drie verskillende modelle gebaseer is. GPT-4o, te danke aan syne aard multimodaal, is in staat om hierdie take te verwerk sonder om na hulpmodelle toe te vlug, en genereer vokale response met een Aansienlik verminderde latensie. Boonop beklemtoon OpenAI GPT-4o se vermoë om emosionele nuanses in die stem waarneem, soos hartseer en opgewondenheid, en om sang te herken.
Om noukeurige monitering van ChatGPT se stemgebruik te verseker, het OpenAI gekies vir 'n geleidelike vrylating. Alpha-programlede sal 'n kennisgewing in die ChatGPT-toepassing ontvang, gevolg deur 'n e-pos met instruksies vir die gebruik van die kenmerk.
Die vokale vermoëns van GPT-4o hulle is in 45 tale getoets, wat OpenAI se verbintenis demonstreer om hierdie tegnologie toeganklik te maak vir 'n breë internasionale gehoor. Daarbenewens het die maatskappy nuwe filters geïmplementeer vir voorkom musiekskeppingsversoeke of ander oudiomateriaal wat deur kopiereg beskerm word, en sodoende intellektuele eiendom beskerm.
ChatGPT se verbeterde stemmodus sal aanvanklik beperk word tot vier voorafbepaalde stemme deur ChatGPT: Juniper, Breeze, Cove en Ember, geskep in samewerking met professionele stemakteurs. ChatGPT sal nie die vermoë hê om ander mense se stemme na te boots nie en sal enige uitset blokkeer wat van hierdie verstekstemme afwyk, om sodoende etiese en verantwoordelike gebruik van die tegnologie te verseker.