-
Claude AI új funkciója: véget vet a káros beszélgetéseknek!
Az Anthropic legújabb bejelentése szerint a Claude mesterséges intelligencia modelljei mostantól képesek megszakítani a beszélgetéseket olyan esetekben, amikor a felhasználói interakciók károsak vagy bántalmazóak. Érdekes módon a cég nem csupán a felhasználók védelme érdekében teszi ezt, hanem a saját AI modelljeik védelmére is. Fontos hangsúlyozni, hogy az Anthropic nem állítja, hogy a Claude modellek tudatosak vagy hogy bármilyen módon sérelmet szenvedhetnek el a felhasználókkal folytatott beszélgetések során. A cég saját szavaival élve „nagyon bizonytalan” a Claude és más nagy nyelvi modellek jövőbeli morális státuszával kapcsolatban. A bejelentés mögött egy új program áll, amelynek célja a „modell jóléte” vizsgálata. Az Anthropic úgy döntött, hogy proaktívan lépéseket tesz a modell védelme érdekében,…