Yapay zeka araştırmacısı, Claude Fable 5'in güvenlik önlemlerini


Pliny the Liberator, Claude Fable 5'i sadece 48 saatte jailbreak ettiğini iddia ederek güvenlik önlemlerinin…
Yapay zeka ve siber güvenlik alanında tanınan bir araştırmacı, Anthropic'in yeni yapay zeka modeli Claude Fable 5'in güvenlik önlemlerini aştığını duyurdu. "Pliny the Liberator" takma adıyla bilinen bu kişi, modelin piyasaya sürülmesinin ardından sadece 48 saat içinde bu başarıyı elde ettiğini belirtti.
Pliny, Fable 5'in daha önceki ve daha güçlü Mythos modelinin güvenlik endişeleri nedeniyle daha dikkatli bir versiyonu olarak piyasaya sürüldüğünü ifade etti. Ancak, çeşitli teknikler kullanarak bu modelin içindeki güvenlik engellerini aşmayı başardığını söyledi. Bu teknikler arasında, jailbreak edilmiş Opus 4. 8 versiyonu ve diğer yöntemler yer alıyor.
Araştırmacı, Fable 5'in kullanıcıların zararlı bilgi talep etmesini önlemek için yerleştirilen güvenlik katmanlarının üstesinden gelmek için Unicode, homoglyphs ve uzun bağlam çerçeveleri gibi yöntemler kullandı. Özellikle, istekleri küçük ve masum parçalara ayırarak, her bir parçanın güvenlik filtrelerine takılmadan geçmesini sağladı.
Fable 5'in piyasaya sürülmesi, bazı kripto kullanıcıları arasında endişelere yol açtı. Jailbreak edilmiş bir versiyonun, kripto protokollerine yönelik potansiyel tehditleri artırabileceği düşünülüyor. Pliny, bu durumun araştırmacılar için hayal kırıklığı yarattığını belirterek, modelin sınırlamalarının gerçek araştırmaları engellediğini ifade etti.
Anthropic, Fable 5'in ağır kısıtlamaları nedeniyle eleştirilerin hedefi haline geldi. Kullanıcıların hassas konular hakkında soru sorması durumunda, modelin bu sorulara yanıt vermek yerine daha önceki bir modelle yönlendirdiği belirtiliyor. Bu durum, AI topluluğunda geniş bir hoşnutsuzluk yaratmış durumda.