In die digitale era word kunsmatige intelligensie (KI) al hoe meer deurdringend en vind toepassings in 'n verskeidenheid nywerhede. Onlangs het ons die vordering gesien van Google se projek om musiek te genereer uit 'n eenvoudige 'opdrag'. Vandag ontdek ons dit ook meta sy het haarself in hierdie avontuur geloods, skep taalmodelle in staat is genereer oudio vanaf 'n teksbeskrywing. Die naam van hierdie revolusionêre instrument is 'AudioCraft".
Meta Audiocraft: 'n nuwe horison vir die generering van musiek beskikbaar vir almal (of byna almal)
Audiocraft is 'n KI-gebaseerde instrument wat voordeel trek uit drie taalmodelle: AudioGen, EnCodec en MusicGen. Die doel is om gebruikers toe te laat om oudiosnitte te verkry vanaf 'n eenvoudige teksbeskrywing van waarna hulle wil luister. Audiocraft kan gebruik word om beide musiek en klanke te genereer, sowel as om kompressie-funksionaliteit te bied.
Onder die drie modelle, MusicGen is die een wat spesifiek opgelei is om musiek uit teks te genereer. Om dit te doen, is duisende musieksnitte wat deur Meta gelisensieer is, gebruik. Die opwindendste nuus is dat al drie modelle in vrygestel is oop bron, wat beteken enigiemand kan dit gebruik om gereedskap en toepassings te bou. Volgens Meta is hierdie sjablone spesifiek ontwerp vir musikale kunstenaars en klankontwerpers, met die doel om "inspirasie te verskaf."
Lees ook: Meta se nuwe strategie vir geteikende advertensies: gebruikertoestemming
Die sjablone is reeds beskikbaar en hul kode kan deur afgelaai word Drukkende gesig of die betrokke bladsy GitHub. MusicGen kan gebruik word om KI-gegenereerde brokkies musiekliedjies te kry, terwyl AudioGen kan bruikbare klanke vir musiekproduksie verskaf. EnCodec, aan die ander kant, is 'n AI-gebaseerde kompressie-instrument.
Om 'n stuk musiek te genereer, dit is dit beskryf die musiek wat jy wil kry en druk die 'Genereer'-knoppie. Verder kan jy die beskrywing met 'n oudiolêer of 'n opname van jou mikrofoon vergesel om die model meer presies te laat verwerk die tipe musiek wat jy wil genereer.
Die gegenereerde oudio sal 'n snit van ongeveer 12 sekondes lank wees. Om 'n instrument te kry wat meer volledige brokkies kan genereer, sal ons moet wag vir een of ander ontwikkelaar om 'n toepassing te skep wat op hierdie modelle gebaseer is. Meta verskaf die gereedskap, nou is dit aan die gemeenskap om te ontdek wat daarmee gedoen kan word.