ZafiyetAI | Yapay Zeka Güvenlik Atlası | Makine Öğrenmesi Modellerinin Açıklarını Keşfetmek

Makine Öğrenmesi Modellerinin Açıklarını Keşfetmek

Siber saldırganlar, yapay zeka sistemlerindeki güvenlik açıklarını tespit etmek için çeşitli yöntemler kullanır. Bu yöntemlerden biri de makine öğrenmesi modellerinin “ontolojisini” keşfetmektir.

Model Ontolojisi Nedir?

Bir makine öğrenmesi modelinin ontolojisi, modelin “çıktı uzayını” tanımlayan bir kavram kümesidir. Çıktı uzayı, modelin sınıflandırabileceği veya tahmin edebileceği olası çıktıların tümüdür.
Örneğin, bir görüntü tanıma modelinin ontolojisi; kedi, köpek, araba gibi nesneleri içerebilir.

Saldırganlar Ontolojiyi Nasıl Keşfeder?

Sorgu Yöntemi: Saldırganlar, modele art arda özel olarak hazırlanmış sorular sorarak modelin çıktı uzayını haritalandırmaya çalışabilir. Bu sorular, modelin her türlü olası çıktısını üretmeye zorlayabilir.
Bilgi Sızdırma: Modelin ontolojisi, konfigürasyon dosyalarında veya modelle ilgili belgelerde yer alabilir. Saldırganlar bu bilgilere erişerek modelin yeteneklerini öğrenebilir.

Ontoloji Bilgisinin Saldırganlara Faydası:

Modelin Kullanım Amacını Anlamak: Saldırganlar, modelin ontolojisini keşfederek, modelin ne tür verileri işlediğini ve hangi amaçlarla kullanıldığını anlayabilir. Bu bilgi, saldırganların daha etkili saldırılar planlamasına yardımcı olur.
Hedefli Saldırılar Oluşturma: Saldırganlar, modelin ontolojisini bilerek, modelin aldatılmasını sağlayacak özel veriler üretebilirler. Örneğin, bir görüntü tanıma modelini aldatmak için, modelin yanlış sınıflandıracağı yapay bir görüntü oluşturabilirler.

Korunma Yolları:

Model Gizliliği: Makine öğrenmesi modellerinin çalışma şekli ve yetenekleri hakkında gereğinden fazla bilgi paylaşmamak önemlidir. Bu, saldırganların bilgi sızdırması yoluyla modelin ontolojisini keşfetmesini zorlaştırır.
Veri Çeşitliliği: Modelin eğitiminde, modelin karşılaşabileceği her türlü veri türünü kapsayan çeşitlilikte veriler kullanmak önemlidir. Bu, modelin aldatılmasını zorlaştırır.
Model Güncellemeleri: Modelleri ve ilgili yazılımları güncel tutmak, bilinen güvenlik açıklarını kapatarak saldırganların işini zorlaştırır.
Anomali Tespiti: Modellerin davranışlarını izlemek ve olağan dışı aktiviteleri tespit etmek için anomali tespit sistemleri kullanılabilir. Bu sistemler, modelin aldatılmaya çalışıldığını veya anormal verilerle karşı karşıya kaldığını ortaya çıkarabilir.