Klets GPT, ontwikkel deur OpenAI, stel nuwe vermoëns bekend wat jou toelaat om deur stem en beelde te kommunikeer, wat 'n intuïtiewe koppelvlak en meer maniere bied om ChatGPT in jou daaglikse lewe te integreer. In 'n onlangse aankondiging op sy webwerf het OpenAI besluit om hierdie nuwe kenmerke vooraf te openbaar. Net so het hy ook die voordele wat dit meebring en die uitdagings wat dit in die groeiende KI-mark bied, uitgelig.
Onderwerpe van hierdie artikel:
ChatGPT: steminteraksie
Met die nuwe stemfunksie kan gebruikers hê interaktiewe gesprekke met ChatGPT. Dit laat jou toe om die assistent selfs onderweg te gebruik, wat die potensiaal van die chatbot verhoog. Byvoorbeeld, 'n gebruiker kan ChatGPT vra om 'n kinderverhaal te vertel terwyl hy op pad is, wat dit lekkerder maak.
Of, tydens 'n aandete saam met vriende, kan 'n debat oor 'n spesifieke onderwerp na vore kom; in hierdie geval kan gebruikers die bot gebruik om akkurate inligting te bekom en die debat konstruktief op te los.
ChatGPT se stemtegnologie gebruik 'n gevorderde teks-na-spraak-model. In samewerking met professionele stemakteurs is hierdie model in staat om menslike klank uit teks en kort stemmonsters te genereer, wat interaksie met ChatGPT selfs meer natuurlik en intuïtief maak. Ook te danke aan fluister, 'n oopbron-spraakherkenningstelsel wat deur OpenAI ontwikkel is, gesproke woorde is met groot akkuraatheid in teks getranskribeer, wat die kletsbot toelaat om gebruikersversoeke te verstaan en effektief daarop te reageer.
ChatGPT: visuele interaksie
Soos hierbo, kan die KI-model nou analiseer een of meer beelde, wat gebruikers in staat stel om probleme op te los, maaltye te beplan of komplekse grafieke te analiseer. Byvoorbeeld, 'n gebruiker kan 'n foto van die inhoud van hul yskas indien. Die kletsbot moet dus gebruik word ontleed die kosse wat teenwoordig is en stel resepte voor gebaseer op hierdie bestanddele, verskaf ook stap-vir-stap instruksies vir voorbereiding.
Lees ook: GPT-4: Tweeling sal Google se mededinger wees. Hier is die verskille
Verder, as die gebruiker op 'n spesifieke element in die beeld moet fokus, ChatGPT se mobiele toepassing bevat 'n tekeninstrument wat jou in staat stel om spesifieke areas van die beeld uit te lig, wat kommunikasie en analise selfs meer presies en persoonlike maak.
Beeldbegrip word aangedryf deur die GPT-3.5 en GPT-4 multimodale modelle. Hierdie gevorderde modelle hulle pas hul taalvaardighede toe op 'n wye reeks beelde, soos foto's, skermkiekies en dokumente wat beide teks en beelde bevat, sodat ChatGPT die visuele konteks akkuraat en in detail kan verstaan en interpreteer.
Dit is die moeite werd om te noem dat vanaf poco OpenAI het nie net dit geïntegreer nie Canva maar ook DALL-E 3 in ChatGPT, of die generatiewe beeldmodel.
Wanneer en vir wie dit beskikbaar sal wees
In die volgende twee weke sal OpenAI stem en beelde in ChatGPT vir gebruikers implementeer gebruikers met Plus- en Enterprise-intekeninge.
Die funksie wat steminteraksie moontlik maak, sal beskikbaar wees op iOS en Android maar nie op die webweergawe nie, wat die een is wat deur die meeste mense gebruik word.
Die funksie wat visuele interaksie moontlik maak, sal eerder beskikbaar wees op alle platforms, dus Android, iOS en web.
Bron | OpenAI