Stel jy belang in hulle KWOTASIE? Bespaar met ons koepons aan WhatsApp o TELEGRAM!

Llama 3 daag die reuse uit: hier is Meta se nuwe KI-model

18 April 2024

Meta het twee nuwes bygevoeg linguistiese modelle na sy reeks: Lama 3 8B e Lama 3 70B. Hierdie beloof voortreflike prestasie in die wêreld van kunsmatige intelligensie. Die treffendste nuus? Die teenwoordigheid van onderskeidelik 8 miljard en 70 miljard parameters. Hierdie getalle verteenwoordig die kompleksiteit en vermoë van die model om te hanteer en te verwerk inligting.

Llama 3 is nie net twee modelle nie: meer materiaal is op pad

Meta stop nie daar nie; beplan om stel meer modelle in die Llama 3-reeks vry, maar sonder om 'n datum te spesifiseer. Hierdie strategie skep afwagting en demonstreer ook die maatskappy se verbintenis om sy aanbiedinge voortdurend te verbeter.

I nuwe Llama-modelle hulle word beskryf as 'n sprong vanaf vorige modelle. Hierdie verbetering is deels te danke aan die gebruik van twee pasgemaakte GPU-klusters, elk met 24.000 XNUMX eenhede, wat dit moontlik gemaak het om modelle meer effektief en akkuraat opgelei te word. Meta beweer dat, as gevolg van die aantal parameters wat hulle besit, hierdie modelle is onder die beste beskikbaar vandag vir generatiewe kunsmatige intelligensie.

Llama 3 se prestasie is gemeet deur verskeie KI-maatstawwe, wat gestandaardiseerde toetse is wat gebruik word om die vermoëns van KI-modelle te evalueer. Dit sluit in MMLU vir kennis, ARC vir die aanleer van vaardighede, bv DROP vir redenasie oor blokke teks. Alhoewel daar verskillende menings oor die bruikbaarheid van hierdie maatstawwe is, bly dit 'n algemene metode om die vermoëns van KI-modelle te evalueer en te vergelyk.

In die besonder het Llama 3 8B beter gevaar as soortgelyke oopbronmodelle met minder parameters, soos Mistral en Google Gemma, in ten minste nege verskillende maatstawwe. Dit sluit toetse in oor algemene kennis, redenasie en spesifieke vaardighede in gebiede soos biologie, fisika, chemie, en selfs kodegenerering en wiskundeprobleme. Wat GPT-4 byvoorbeeld nie baie goed kan doen nie.

Die grootste model, Llama 3 70B, ding nie net mee nie, maar oortref in sommige gevalle vlagskipmodelle soos bv. Gemini 1.5 Pro van Google in verskeie toetse, wat toon dat dit ondanks sterk mededinging selfs die reuse van die sektor kan weerstaan. Dit is egter belangrik om daarop te let dat terwyl dit beter presteer as sommige vlagskipmodelle soos Claude 3 Sonnet deur Anthropic in verskeie toetse bereik dit nie die prestasie van die meer gevorderde Claude 3 Opus-model nie.