Az Anthropic bejelentette a Claude 3 modellcsaládját, amely új mércét állít fel a kognitív feladatok széles körében.
A család három modellt foglal magában: Claude 3 Haiku, Claude 3 Sonnet és Claude 3 Opus. Mindegyik modell egyre erőteljesebb teljesítményt nyújt, lehetővé téve a felhasználók számára, hogy kiválasszák az intelligencia, sebesség és költség optimális egyensúlyát saját alkalmazásaikhoz.
Az Opus és a Sonnet már elérhető a claude.ai-n és a Claude API-n keresztül, amely most már 159 országban általánosan elérhető. A Haiku is hamarosan elérhető lesz.
Új szabvány az intelligenciában
Az Opus, a legintelligensebb modell, a legtöbb közös értékelési benchmarkon túlszárnyalja társait, beleértve az alapképzési szintű szakértői tudást (MMLU), a posztgraduális szintű szakértői érvelést (GPQA) és az alap matematikát (GSM8K). Majdnem emberi szintű megértést és folyékonyságot mutat bonyolult feladatokon, az általános intelligencia határát súrolva.
Azonnali eredmények
A Claude 3 modellek képesek élő ügyfélszolgálati csevegéseket és automatikus kiegészítéseket támogatni, ahol a válaszoknak azonnalinak és valós időben kell lenni.
A Haiku a piac leggyorsabb és legköltséghatékonyabb modellje az intelligenciájának kategóriájában. Kevesebb mint három másodperc alatt képes elolvasni egy információ- és adatsűrű kutatási cikket az arXiv-en (~10k token) diagramokkal és grafikonokkal. A bevezetést követően várhatóan tovább javítják a teljesítményt.
Erős látási képességek
A Claude 3 modellek fejlett látási képességekkel rendelkeznek, amelyek összehasonlíthatók más vezető modellekkel. Képesek széles körű vizuális formátumokat feldolgozni, beleértve a fényképeket, diagramokat, grafikonokat és műszaki rajzokat.
Javított pontosság
Az előző Claude modellek gyakran szükségtelen visszautasításokat tettek, amelyek kontextus hiányát sugalltak. Jelentős előrelépést tettek ezen a területen: az Opus, a Sonnet és a Haiku kevésbé valószínű, hogy visszautasítanák a rendszer védőkorlátaihoz közel eső kéréseket, mint az előző generációk modellei.
A vállalkozások minden méretben támaszkodhatnak a modellekre az ügyfeleik kiszolgálásához, ezért létfontosságú, hogy a modellek kimenetei nagy pontosságot tartsanak fenn nagy léptékben. Az Opus kétszeres javulást mutat a pontosságban (vagy helyes válaszokban) ezeken a kihívást jelentő nyitott kérdéseken az előző Claude 2.1-hez képest, miközben csökkentette a helytelen válaszok szintjét.
Felelős tervezés
A Claude 3 modellcsaládot úgy fejlesztették ki, hogy megbízhatóak legyenek, amennyire csak képesek. Több dedikált csapat követi és mérsékli a kockázatok széles spektrumát, a dezinformációtól és a CSAM-tól kezdve a biológiai visszaéléseken át az választási beavatkozásokig és az autonóm reprodukciós készségekig.
A Claude 3 modellek jobban követik a bonyolult, többlépéses utasításokat. Különösen ügyesek a márka hangjának és válaszirányelveinek betartásában, valamint olyan ügyfélközpontú élmények fejlesztésében, amelyekben felhasználóink megbízhatnak.