Makine Öğrenmesi Modellerinin Açıklarını Keşfetmek

Siber saldırganlar, yapay zeka sistemlerindeki güvenlik açıklarını tespit etmek için çeşitli yöntemler kullanır. Bu yöntemlerden biri de makine öğrenmesi modellerinin “ontolojisini” keşfetmektir.

Model Ontolojisi Nedir?

  • Bir makine öğrenmesi modelinin ontolojisi, modelin “çıktı uzayını” tanımlayan bir kavram kümesidir. Çıktı uzayı, modelin sınıflandırabileceği veya tahmin edebileceği olası çıktıların tümüdür.
  • Örneğin, bir görüntü tanıma modelinin ontolojisi; kedi, köpek, araba gibi nesneleri içerebilir.

Saldırganlar Ontolojiyi Nasıl Keşfeder?

  • Sorgu Yöntemi: Saldırganlar, modele art arda özel olarak hazırlanmış sorular sorarak modelin çıktı uzayını haritalandırmaya çalışabilir. Bu sorular, modelin her türlü olası çıktısını üretmeye zorlayabilir.
  • Bilgi Sızdırma: Modelin ontolojisi, konfigürasyon dosyalarında veya modelle ilgili belgelerde yer alabilir. Saldırganlar bu bilgilere erişerek modelin yeteneklerini öğrenebilir.

Ontoloji Bilgisinin Saldırganlara Faydası:

  • Modelin Kullanım Amacını Anlamak: Saldırganlar, modelin ontolojisini keşfederek, modelin ne tür verileri işlediğini ve hangi amaçlarla kullanıldığını anlayabilir. Bu bilgi, saldırganların daha etkili saldırılar planlamasına yardımcı olur.
  • Hedefli Saldırılar Oluşturma: Saldırganlar, modelin ontolojisini bilerek, modelin aldatılmasını sağlayacak özel veriler üretebilirler. Örneğin, bir görüntü tanıma modelini aldatmak için, modelin yanlış sınıflandıracağı yapay bir görüntü oluşturabilirler.

Korunma Yolları:

  • Model Gizliliği: Makine öğrenmesi modellerinin çalışma şekli ve yetenekleri hakkında gereğinden fazla bilgi paylaşmamak önemlidir. Bu, saldırganların bilgi sızdırması yoluyla modelin ontolojisini keşfetmesini zorlaştırır.
  • Veri Çeşitliliği: Modelin eğitiminde, modelin karşılaşabileceği her türlü veri türünü kapsayan çeşitlilikte veriler kullanmak önemlidir. Bu, modelin aldatılmasını zorlaştırır.
  • Model Güncellemeleri: Modelleri ve ilgili yazılımları güncel tutmak, bilinen güvenlik açıklarını kapatarak saldırganların işini zorlaştırır.
  • Anomali Tespiti: Modellerin davranışlarını izlemek ve olağan dışı aktiviteleri tespit etmek için anomali tespit sistemleri kullanılabilir. Bu sistemler, modelin aldatılmaya çalışıldığını veya anormal verilerle karşı karşıya kaldığını ortaya çıkarabilir.