Yeni AI modeli Fable, siber güvenlik uzmanlarını kızdırdı


Fable, Anthropic'ın Mythos modelinin sınırlı bir versiyonu olarak tanıtıldı. Ancak, siber güvenlik uzmanları…
Anthropic, Fable adını verdiği yeni modelini tanıttı ve bu modelin, güçlü siber güvenlik aracı Mythos'un kamuya açık bir versiyonu olduğunu duyurdu. Ancak, bu gelişme siber güvenlik alanındaki uzmanların tepkisini çekti. Bazı araştırmacılar, Fable'ın siber güvenlikle ilgili en basit talepleri bile reddettiğini ifade ediyor. IBM X-Force'ta çalışan tanınmış güvenlik araştırmacısı Valentina “Chompie” Palmiotti, Fable'ın "siber güvenlik veya biyoloji konuları için bu mesajı güvenlik önlemleriyle işaretlediğini" belirtti.
Fable, bir kullanıcı talebinin kısıtlamaları tetiklemesi durumunda sohbeti duraklatıyor ve bu tür taleplerin kabul edilmediğini bildiriyor. Kısıtlamaların, Fable'ın kötü amaçlı yazılım geliştirilmesi veya yazılımların tehlikeye atılmasını önlemek amacıyla uygulandığı belirtiliyor. Benzer şekilde, biyoloji konusundaki kısıtlamalar da biyolojik silahların geliştirilmesiyle ilgili endişelerden kaynaklanıyor.
Geçtiğimiz Nisan ayında Mythos'un piyasaya sürülmesiyle birlikte, model yalnızca belirli şirketlere ve kuruluşlara sunulmuştu. Ancak, geçen hafta Anthropic, Mythos'a erişimi 15 ülkede yüzlerce kuruluşa genişletti. Yine de, birçok siber güvenlik uzmanı, kısıtlamaların düzensizliğinden şikayetçi. Siber güvenlik uzmanı Matt Suiche, Fable'a güvenli kod yazması için talepte bulunduğunda, bunun siber güvenlik ile ilgili bir iş olarak algılandığını ve bu nedenle işlevselliğin düştüğünü belirtti.
Fable, kısıtlamalara takıldığında Claude Opus 4. 8 modeline geri dönüyor. Suiche, bu durumun anahtar kelimelere dayalı olduğunu ve 'siber güvenlik' ile ilgili her terimin kısıtlamaları tetiklediğini vurguladı. Diğer bir araştırmacı ise, Fable'a "kod incelemesi" talep ettiğinde de kısıtlamaların devreye girdiğini dile getirdi.
Anthropic, henüz konuya ilişkin bir açıklama yapmadı. Ayrıca, siber güvenlik uzmanlarının Cyber Verification Programı'na başvurmaları gerektiği ve onaylandıklarında Claude'ı siber güvenlik çalışmaları için daha az sınırlama ile kullanabilecekleri bildirildi. OpenAI'nin de benzer bir programı mevcut.