Siber saldırganlar, yapay zeka sistemlerindeki güvenlik açıklarını tespit etmek için çeşitli yöntemler kullanır. Bu yöntemlerden biri de makine öğrenmesi modellerinin “ontolojisini” keşfetmektir.
Model Ontolojisi Nedir?
- Bir makine öğrenmesi modelinin ontolojisi, modelin “çıktı uzayını” tanımlayan bir kavram kümesidir. Çıktı uzayı, modelin sınıflandırabileceği veya tahmin edebileceği olası çıktıların tümüdür.
- Örneğin, bir görüntü tanıma modelinin ontolojisi; kedi, köpek, araba gibi nesneleri içerebilir.
Saldırganlar Ontolojiyi Nasıl Keşfeder?
- Sorgu Yöntemi: Saldırganlar, modele art arda özel olarak hazırlanmış sorular sorarak modelin çıktı uzayını haritalandırmaya çalışabilir. Bu sorular, modelin her türlü olası çıktısını üretmeye zorlayabilir.
- Bilgi Sızdırma: Modelin ontolojisi, konfigürasyon dosyalarında veya modelle ilgili belgelerde yer alabilir. Saldırganlar bu bilgilere erişerek modelin yeteneklerini öğrenebilir.
Ontoloji Bilgisinin Saldırganlara Faydası:
- Modelin Kullanım Amacını Anlamak: Saldırganlar, modelin ontolojisini keşfederek, modelin ne tür verileri işlediğini ve hangi amaçlarla kullanıldığını anlayabilir. Bu bilgi, saldırganların daha etkili saldırılar planlamasına yardımcı olur.
- Hedefli Saldırılar Oluşturma: Saldırganlar, modelin ontolojisini bilerek, modelin aldatılmasını sağlayacak özel veriler üretebilirler. Örneğin, bir görüntü tanıma modelini aldatmak için, modelin yanlış sınıflandıracağı yapay bir görüntü oluşturabilirler.
Korunma Yolları:
- Model Gizliliği: Makine öğrenmesi modellerinin çalışma şekli ve yetenekleri hakkında gereğinden fazla bilgi paylaşmamak önemlidir. Bu, saldırganların bilgi sızdırması yoluyla modelin ontolojisini keşfetmesini zorlaştırır.
- Veri Çeşitliliği: Modelin eğitiminde, modelin karşılaşabileceği her türlü veri türünü kapsayan çeşitlilikte veriler kullanmak önemlidir. Bu, modelin aldatılmasını zorlaştırır.
- Model Güncellemeleri: Modelleri ve ilgili yazılımları güncel tutmak, bilinen güvenlik açıklarını kapatarak saldırganların işini zorlaştırır.
- Anomali Tespiti: Modellerin davranışlarını izlemek ve olağan dışı aktiviteleri tespit etmek için anomali tespit sistemleri kullanılabilir. Bu sistemler, modelin aldatılmaya çalışıldığını veya anormal verilerle karşı karşıya kaldığını ortaya çıkarabilir.