Siber saldırganlar, yapay zeka sistemlerine karşı saldırı gerçekleştirmeden önce çeşitli yöntemlerle sistemleri manipüle etmeye çalışabilir. Bu yöntemlerden biri de “arka kapılı model” (backdoored model) kullanımıdır.
Arka Kapılı Model Nedir?
Arka kapılı model, saldırganlar tarafından yapay zeka modeline gizlice eklenen bir arka kapıdır. Bu model, normal şartlarda beklenen şekilde çalışır ancak saldırganın istediği çıktıları üretmek üzere modelin girdisine gizli bir tetikleyici (trigger) eklendiğinde farklı davranır.
Arka Kapılı Model Saldırganlara Nasıl Fayda Sağlar?
- Gizli ve Sürekli Saldırı Yeteneği: Arka kapılı model, saldırgana kurbanın sistemine yerleşik ve kalıcı bir saldırı aracı sunar. Bu sayede saldırgan, istediği zaman tetikleyiciyi kullanarak modelin davranışını değiştirebilir.
- Zor tespit Edilebilirlik: Arka kapılı modeller genellikle normal çalışma koşullarında beklenen şekilde çalıştıkları için tespit edilmeleri zordur. Bu durum, saldırgana uzun süre boyunca gizli kalma imkanı tanır.
Tetikleyici (Trigger) Nasıl İşler?
Tetikleyici, saldırganın modelin davranışını değiştirmesi için modelin girdisine eklediği özel bir sinyaldir. Bu sinyal çeşitli şekillerde gizlenebilir:
- Veri Değişiklikleri: Saldırgan, modelin girdi verilerini belli bir şekilde manipüle ederek tetikleyiciyi aktive edebilir.
- Gizli Semboller: Saldırgan, insan gözüyle fark edilemeyecek kadar küçük değişiklikler (örneğin, gürültü ekleme) ile tetikleyiciyi verinin içerisine gizleyebilir.
- Zaman Bazlı Tetikleyiciler: Bazı arka kapılı modellerde, tetikleyici belli bir tarihte veya saatte otomatik olarak aktif hale gelebilir.
Korunma Yolları:
- Model Eğitim Süreci Güvenliği: Modelin eğitimi sırasında güvenli bir ortam kullanmak ve eğitim verilerinin yetkisiz erişime karşı korunması önemlidir.
- Model Açıklanabilirliği (Explainable AI): Modelin karar verme süreçlerini anlayabilmeye yönelik Explainable AI (XAI) tekniklerini kullanmak, model davranışındaki anormallikleri tespit etmeyi kolaylaştırabilir.
- Model İzleme: Makine öğrenmesi modellerinin davranışlarını sürekli olarak izlemek ve olağan dışı aktiviteleri tespit etmek için anomali tespit sistemleri kullanılmalıdır.
- Model Doğrulama: Modellerin eğitimi ve dağıtımı sonrasında düzenli olarak doğrulanması ve güvenlik açığı taramalarına tabi tutulması önemlidir.