Új korszak kezdődik az AI ügynökök fejlődésében: dinamikus eszközhasználat és hatékony kódvezérelt vezérlés

Az AI ügynökök jövője abban rejlik, hogy képesek lesznek zökkenőmentesen együttműködni akár több száz, vagy akár több ezer eszközzel és szolgáltatással. Legyen szó fejlesztői környezetről, ahol a git műveletektől a tesztelési keretrendszerekig és telepítési folyamatokig mindent integrálnak, vagy egy üzemeltetési koordinátorról, ami egyszerre kapcsolódik Slackhez, GitHubhoz, Google Drive-hoz, Jira-hoz és különféle szerverekhez, az AI ügynököknek hatékonyan kell kezelniük a komplex eszközkönyvtárakat anélkül, hogy minden definíciót előre betöltenének a kontextusba.

Az Anthropic csapata legújabb fejlesztései három kulcsfontosságú új funkcióval bővítik Claude AI képességeit, amelyek forradalmasítják az eszközök kezelési módját: a dinamikus eszközkeresést (Tool Search Tool), a programozott eszközhívást (Programmatic Tool Calling) és az eszközhasználati példák bevezetését (Tool Use Examples). Ezek a megoldások együtt jelentősen növelik az AI pontosságát, hatékonyságát és skálázhatóságát.

Dinamikus eszközkeresés: a hatalmas eszközkönyvtárak kezelése

Az egyik legnagyobb kihívás az, hogy az AI modellek kontextusablaka korlátozott, és a sok eszköz definíciója akár több tízezer token helyet foglalhat el – ez jelentősen lassítja és nehezíti a munkát. Például egy átlagos, öt szerverből álló rendszer több mint 50 eszközt tartalmazhat, amelyek összesen akár 55 000 token helyet foglalnak, és ez még tovább növekszik, ha további szervereket, például Jira-t is hozzáadunk.

A Tool Search Tool megoldja ezt azzal, hogy nem tölti be az összes eszköz definícióját előre, hanem csak az adott feladat szempontjából releváns eszközöket keresi meg és tölti be dinamikusan. Így Claude AI akár 85%-kal kevesebb token használattal is dolgozhat, miközben hozzáfér teljes eszközkönyvtárához. A belső tesztek azt mutatják, hogy ez jelentős pontosságnövekedéssel jár: például a Tool Search Tool használatával egyes értékeléseken a pontosság 49%-ról 74%-ra, illetve 79,5%-ról 88,1%-ra nőtt.

Programozott eszközhívás: hatékonyabb és pontosabb munkamenetek

A hagyományos eszközhasználat során minden egyes eszközhívás a teljes modell újraértékelését igényli, és az eredmények előzetes feldolgozása nagy mennyiségű, gyakran fölösleges adatot tölt a kontextusba. Ez lassú, drága és hibákhoz vezethet.

Ezzel szemben a Programmatic Tool Calling lehetővé teszi, hogy Claude közvetlenül kód formájában írja meg az eszközök használatát és az adatok feldolgozását, így az AI nem kapja meg a részletes, nyers adatokat, hanem csak a végső, összesített eredményt. Ez nemcsak jelentős token-megtakarítást eredményez – akár 37%-kal kevesebb tokenhasználattal –, hanem a válaszadási időt is csökkenti, és növeli a pontosságot.

Például egy utazási költségvetési ellenőrzés során Claude egyetlen Python szkriptet generál, amely párhuzamosan hívja meg az összes szükséges eszközt, összesíti az adatokat, és csak a túllépést jelentő csapattagokat jeleníti meg. Így több ezer adatpont helyett csak a releváns összegzés kerül a modell kontextusába.

Eszközhasználati példák: pontosabb és konzisztens eszközhívások

Az eszközök működését meghatározó JSON sémák jól definiálják az adatstruktúrát, de nem adnak választ arra, hogyan és mikor használjuk helyesen az opcionális paramétereket, vagy milyen kombinációk értelmesek egy adott API-ban. Ez gyakran vezet hibás vagy nem optimális hívásokhoz.

Az új Tool Use Examples funkcióval konkrét, valós példákat adhatunk meg az eszközhasználatra, amelyek segítik Claude-ot abban, hogy a helyes paramétereket és mintákat kövesse. Ez különösen hasznos összetett, többszintű adatstruktúrák és speciális API-k esetén. Belső tesztek szerint a pontosság akár 72%-ról 90%-ra is javulhat a komplex paraméterkezelésben.

Hogyan érdemes alkalmazni az új funkciókat?

Ezek a fejlesztések nem egymást kizáró alternatívák, hanem egymást kiegészítő megoldások. Az optimális eredmény eléréséhez érdemes először az adott projekt legnagyobb szűk keresztmetszetére fókuszálni: ha a kontextusbeli túlterhelés a fő probléma, akkor a Tool Search Tool segít; ha a köztes eredmények túl sok helyet foglalnak, a Programmatic Tool Calling a megfelelő választás; ha pedig a paraméterek helyes használata okoz nehézséget, akkor az eszközhasználati példák bevezetése ajánlott.

Emellett fontos a jól strukturált eszközdefiníciók és világos dokumentáció, amelyek támogatják az AI-t az eszközök hatékony és hibamentes használatában.

Összegzés

Az Anthropic legújabb fejlesztései jelentős előrelépést jelentenek az AI ügynökök eszközhasználatában. A dinamikus eszközkeresés, a programozott eszközhívás és a példákkal támogatott paraméterkezelés együttesen lehetővé teszik, hogy az AI rendszerek komplex, több ezer eszközt magában foglaló ökoszisztémákban is gyorsan, pontosan és hatékonyan működjenek.

Ez az innovatív megközelítés új kapukat nyit meg a fejlesztők és vállalatok előtt, hogy még összetettebb és skálázhatóbb AI-alapú megoldásokat hozzanak létre, melyek képesek valós idejű, megbízható döntéseket hozni és komplex munkafolyamatokat kezelni.

Az új funkciók jelenleg béta verzióban érhetők el, és a fejlesztők már hozzáférhetnek részletes dokumentációhoz és példákhoz, hogy minél könnyebben adaptálhassák ezeket az eszközöket saját projektjeikbe. Az AI ügynökök fejlődése most új lendületet kap, és izgalmas lehetőségeket kínál a jövő digitális munkakörnyezeteihez.

Forrás: az eredeti angol cikk itt olvasható