Siber güvenlik istatistikleri:
Metodoloji ve kaynaklar
Bu sayfanın amacı
Bu sayfada, Siber Güvenlik İstatistikleri verilerinin nasıl toplandığı, işlendiği ve yorumlandığı ile veri kaynakları şeffaf bir şekilde açıklanır. Ana Siber Güvenlik İstatistikleri sayfasında özetlenmiş bulgular ve NordVPN araştırma içgörüleri sunulur.
Veri kaynakları ve atıf
Kaynak keşfi, Google Custom Search API (GCS) aracılığıyla, aşağıdakiler için yapılandırılmış birden fazla Özel Arama Motoru (CSE) kullanılarak gerçekleştirilir:
medya kuruluşları: 44 ana akım ve teknoloji medya kaynağı (ör. BBC, CNN, The New York Times, WSJ, FT, Reuters, Bloomberg, TechCrunch, Wired, Ars Technica, Time, Forbes).
yetkili/kaynak siteler: 25 sektör ve uzman kaynağı (ör. CISA, KrebsOnSecurity, The Hacker News, Dark Reading, BleepingComputer, SecurityWeek, Infosecurity Magazine).
yerel haberler: APAC, EMEA ve Amerika'da 100'den fazla bölgesel ve ulusal yayın organı (ör. Channel NewsAsia, CSA.gov.sg, Zaobao; HK01, unwire.hk; Japan Times, NISC, JPCERT, ITMedia).
kısıtlamasız/genel.
Sorgular, terimleri kategoriye göre gruplandıran, düzenli olarak güncellenen bir anahtar kelime listesinden alınan anahtar kelimelere dayanır.
Tüm kayıtlar açık atıf içerir:
Orijinal makale bağlantısı
Medya kuruluşu (URL'den çıkarılan alan adı)
Yayın tarihi ve toplama tarihi
İstatistikler ve olayların bir araya getirilmesi için birçok kaynaktan gelen bilgileri sentezliyoruz; her istatistik, bağlantılarla birlikte saklanan makale düzeyindeki kanıtlardan elde edilir.
İçerik alma ve toplama sıklığı
Aşağıdakileri kullanarak, keşfedilen bağlantılardan tam metin içeriğini alır:
Birincil: NewsPlease
Yedek: Güçlendirilmiş istek oturumu ve trafilatura çıkarma ile doğrudan HTML indirme.
Geçici hataları azaltmak için zaman aşımı, yeniden deneme, TLS yedekleme ve referer başlıkları kullanılır.
Yayın tarihi ve başlık, mevcut olduğunda çıkarıcıdan alınır; tarih ayrıştırma işlemi yalnızca tarih olarak normalleştirilir.
Günlük çalıştırmalar, son 1 günlük içeriği sorgular.
Özellik çıkarma
Çıkarılan alanlar şunları içerir:
Medya kuruluşu (URL'den)
İlk paragraf (ilk 3-5 cümle)
Anahtar kelime özellikleri: metindeki toplam sayı, başlıkta bulunma durumu, ana anahtar kelimeyi içeren cümleler ve tutulan listedeki herhangi bir anahtar kelimenin bulunma durumu
Kelime sayısı
LLM uygunluk değerlendirmesi
Her makale, deterministik bir ayar (sıcaklık 0) ve açık, yapılandırılmış çıktılar gerektiren kısıtlı bir komutla bir LLM tarafından değerlendirilir:
1. Makalenin siber olayla ilgili olup olmadığı
2. İlgiliyse üst düzey bir olay türü atanır:
Olay: Onaylanmış bir siber saldırı veya ihlal zaten gerçekleşmiştir (ör. fidye yazılımı kullanımı, veri sızıntısı, DDoS, sistemin tehlikeye girmesi).
Güvenlik açığı: Yazılım/donanım/sistemlerde istismar edilebilecek bir güvenlik kusurunun keşfi veya ifşası (doğrulanmış istismar yerine potansiyel risk).
Tehdit istihbaratı: Tehdit aktörleri, araçlar, TTP'ler ve kampanyalar hakkında raporlama; belirli bir mağdur olayına değil, “kim/nasıl” sorusuna odaklanır.
Düzenleyici-Yasal: Siber güvenlik yükümlülüklerini etkileyen yasalar, yönetmelikler, yaptırım eylemleri, mahkeme kararları veya önemli politika değişiklikleri.
Makale türü ve sınıflandırma
İlgili makaleler, yapılandırılmış sınıflandırma istemleri aracılığıyla kategorize edilir (birincil: saldırı durumu, olay türü, düzenleyici/yasal; ikincil: etki ölçütleri/sınıfı, teknik özellikler, sektörler, coğrafya, boyut, yaklaşık hasar).
Olay kümeleme (makaleden olaya toplama)
Amaç: Aynı temel olayı tanımlayan makaleleri tek bir "olay" altında gruplandırmak.
Yöntem:
Bağlam sağlamak için veri tabanından mevcut olayları alın (başlıklar, etkilenen bilinen kuruluşlar, tehdit aktörleri, bağlantılar).
Her aday makale için (Makale Türü = Tek Olay olduğunda), LLM makale ayrıntılarını mevcut olay gruplarıyla karşılaştırır ve şunlardan birini yapar:
1. Yüksek güvenilirlikli bir eşleşme olduğunda mevcut bir olay kimliği atar veya
2. Aksi takdirde yeni bir olay oluşturur.
İstemler yüksek hassasiyeti vurgular: yalnızca yüksek güven olduğunda mevcut bir olaya bağlanır. Etkilenen kuruluş(lar) ve tehdit aktörü sinyalleri güçlü göstergeler olarak değerlendirilir.
Olaylar toplu alanları korur: ilk/son görülme tarihleri, makale sayısı, etkilenen kuruluşlar, tehdit aktörleri, başlıklar, bağlantılar.
Doğruluk ve kalite güvencesi
Determinizm ve kısıtlamalar:
Determinizmi en üst düzeye çıkarmak ve halüsinasyonları azaltmak için LLM sıcaklığı 0 olarak ayarlandı.
Kısıtlı komutlar açık alanlar ve JSON çıktıları gerektirir; ayrıştırma şemayı zorunlu kılar.
İçerik olmayan makaleler (başlık/metin eksik olanlar) erken aşamada reddedilir.
LLM tarafından yönetilen, şema doğrulamalı metrikler:
Tüm metrik alanları, katı, belgelenmiş yönergeler ve JSON şemaları uyarınca deterministik LLM çalışmaları (sıcaklık 0) tarafından üretilir; yalnızca şema uyumlu çıktılar sayılır ve sapmayı kalibre etmek ve önlemek için periyodik insan kalite güvencesi uygulanır.
Hassas filtreleme için olay/makale sınıflandırması:
Olay türü ve makale odağı sınıflandırması, konu dışı, düşük sinyalli veya derleme tarzı içeriği filtreleyen katı bir alaka düzeyi kontrol noktası görevi görür. Tekil olay raporlamasına odaklanmak, gürültüyü azaltır ve veri kümesinin hassasiyetini ve doğruluğunu ölçülebilir şekilde artırır.
Çok kaynaklı doğrulama:
Olay kümeleme, önceden depolanan olay bağlamına başvurur; uyumsuzluklar yanlış birleştirme olasılığını azaltır.
Toplamalar, manuel doğrulama için olay başına kaynak bağlantıların listesini içerir.
İnsan denetimli:
Yüksek etkili veya belirsiz vakalar, editöryal inceleme ve doğruluk kontrolü için işaretlenebilir.
Düzenli kalite güvencesi incelemeleri: Örnek olarak seçilen makaleler ve etkinlikler, hassas bir incelemeyle aylık olarak denetlenir; herhangi bir sapma, istem/model veya anahtar kelime ayarlamalarını tetikler.
İzlenebilirlik:
Her istatistik, denetlenebilirlik için veri tabanında yer alan makalelere ve bağlantılara kadar izlenebilir.
Sınırlamalar
Kapsam limitleri:
GCS tabanlı keşif, anahtar kelimelere ve CSE yapılandırmasına bağlıdır; özellikle yapılandırılan dillerin dışında veya ücretli içeriklerde tüm olaylar yakalanmaz.
Bazı siteler otomatik alımı engeller; bu tür makaleler kısmen veya tamamen eksik olabilir.
LLM'ye özgü riskler:
Deterministik ayarlara ve yapılandırılmış komutlara rağmen, özellikle seyrek veya belirsiz metinlerde yanlış sınıflandırma meydana gelebilir.
Olay kümeleme, aynı olayı birden fazla olaya bölebilir veya uç durumlarda benzer ancak farklı olayları birleştirebilir.
İstatistikler nasıl hesaplanır?
Makale düzeyindeki alanlar, doğrudan çıkarma ve LLM çıktılarından (kayıt başına depolanır) elde edilir.
Olay düzeyindeki metrikler, bileşen makaleleri event_id'ye göre toplar:
makale sayıları, ilk/son görülme tarihleri
etkilenen kuruluşların ve tehdit aktörlerinin tekilleştirilmiş listesi
temsilî başlıklar ve kanonik bağlantı listeleri
Rapor istatistikleri bu depolanan tablolardan alınır; her rakam, olay satırlarına ve temel makale kayıtlarına kadar izlenebilir.
Verilerin kapsamı
Siber güvenlik içeriğimizde atıfta bulunulan istatistikler ve içgörüler aşağıdakilerin bir kombinasyonundan elde edilmiştir:
Herkese açık siber güvenlik olayı raporları
Doğrulanmış siber olayların medyada yer alması
Sektör raporları ve anketleri
Hükûmet ve düzenleyici kurumların açıklamaları
Veriler, küresel olarak meydana gelen tüm siber olayların tamamını değil, kamuya açık olarak gözlemlenebilen ve rapor edilen faaliyetleri yansıtır. Birçok siber olay hiçbir zaman açıklanmaz, rapor edilmez ve medyada yer almaz.
Veri kaynakları ve keşif
Kaynak türleri
Siber güvenlikle ilgili makaleler ve raporlar, aşağıdakiler de dâhil olmak üzere birden fazla kaynak kategorisinden toplanır:
Ana akım ve teknoloji medyası.
Örnekler arasında büyük uluslararası haber kuruluşları ve teknoloji yayınları yer alır.Yetkili ve uzman siber güvenlik kaynakları.
Devlet kurumları, siber güvenlik araştırma kuruluşları ve köklü sektör yayınları dâhil.Bölgesel ve yerel haber kaynakları.
Kuzey Amerika, Avrupa, Asya-Pasifik ve diğer bölgelerdeki siber güvenlik olaylarını kapsar.Sektör ve araştırma raporları.
Yıllık ihlal raporları, tehdit ortamı raporları, anketler ve ekonomik analizler dâhil.
Her kaynak, yayın tarihi, yayın organı ve orijinal URL korunarak makale veya rapor düzeyinde belirtilir.
Keşif süreci
İçerik keşfi, sürekli güncellenen bir siber güvenlik anahtar kelime listesine dayalı otomatik arama sorguları kullanılarak gerçekleştirilir. Anahtar kelimeler konuya göre gruplandırılır (örneğin: veri ihlalleri, fidye yazılımı, kimlik avı, güvenlik açıkları, düzenleme).
Yeni yayınlanan içerikleri yakalamak için günlük aramalar yapılır. Her çalıştırma yalnızca son materyalleri sorgulayarak veri kümesinin güncel raporlamayı yansıtmasını sağlar.
İçerik toplama ve işleme
Makale alma
Bir kaynak bulunduğunda, otomatik çıkarma araçları kullanılarak makalenin tam metni alınır. Birincil çıkarma işleminin başarısız olduğu durumlarda, sağlam kapsama sağlamak için yedek yöntemler kullanılır.
Tekilleştirme
Çift sayımı önlemek için:
Aynı URL'ler yalnızca bir kez işlenir
Yeniden yayınlanan veya dağıtılan içerikler, makale düzeyinde tekilleştirilir
Etkinlik düzeyinde toplama (aşağıda açıklanmıştır), yayın organları arasındaki yinelemeyi daha da azaltır
Alaka düzeyine göre filtreleme ve sınıflandırma
Siber güvenlik alaka düzeyi değerlendirmesi
Her makale, siber güvenlik istatistikleriyle ilgili olup olmadığının belirlenmesi için değerlendirilir. Makaleler bir siber güvenlik olayını, tehdidini, güvenlik açığını veya düzenleyici eylemi anlamlı bir şekilde tanımlamalı veya analiz etmelidir.
Olay türü sınıflandırması
İlgili makaleler, aşağıdakiler de dâhil olmak üzere üst düzey kategorilere ayrılır:
Olay: Gerçekleşmiş olduğu doğrulanmış bir siber saldırı veya ihlal
Güvenlik açığı: İstismar edilebilecek bir güvenlik zafiyetinin ifşa edilmesi
Tehdit istihbaratı: Tehdit aktörleri, araçları, kampanyaları veya teknikleri hakkında raporlama
Düzenleyici / yasal: Siber güvenlikle ilgili yasalar, yaptırım eylemleri, politika değişiklikleri veya yasal işlemler
Bu sınıflandırma, “olaylar”, “ihlaller” veya “saldırılar” ile ilgili istatistiklerin güvenlik açığı açıklamaları veya genel yorumlarla karıştırılmamasını sağlar.
Olay kümeleme (makaleden olaya toplama)
Aynı siber olay hakkında genellikle birden fazla makale yayınlanır. Fazla sayımı önlemek için:
Aynı olayı anlatan makaleler tek bir olay altında gruplandırılır
Olaylara sabit dâhili tanımlayıcılar atanır
Makaleler, yalnızca aynı olayı tanımladıklarına dair güven yüksek olduğunda mevcut olaylara bağlanır
Kümeleme için kullanılan göstergeler arasında etkilenen kuruluşlar, tehdit aktörleri, zaman çizelgeleri ve olay açıklamaları yer alır.
Olay düzeyindeki kayıtlar şunları içerir:
İlk ve son görünüm tarihleri
İlgili makale sayısı
Etkilenen kuruluşlar
Atıfta bulunulan tehdit aktörleri
Doğrulama için kaynak bağlantılar
Otomatik analiz ve kalite kontrollerinin kullanımı
Otomatik sınıflandırma
Sınıflandırma, çıkarma ve toplama için yapılandırılmış, deterministik dil modeli analizi kullanılır. Tüm otomatik çıktılar, tutarlılığı sağlamak için önceden tanımlanmış şemaları takip eder.
Modeller, değişkenlik ve halüsinasyon riskini azaltmak için deterministik ayarlarla çalışır.
Kalite güvencesi
Doğruluğu korumak için:
Şema doğrulaması, yalnızca uygun şekilde yapılandırılmış çıktıların sayılmasını sağlar
Sınıflandırma sapmasını tespit etmek için hassas bir inceleme de dâhil olmak üzere düzenli aylık örnekleme ve inceleme prosedürleri gerçekleştirilir. Bu inceleme, sınıflandırmadaki kaymaları belirler ve bu da modeli bilgilendirir ve modelde ayarlamalar yapılmasını gerektirir.
Belirsiz veya yüksek etkili vakalar, insan incelemesi için işaretlenir
Toplu istatistikler, tek tek makalelere ve olaylara kadar izlenebilirliği korur
İstatistikler nasıl hesaplanır?
Makale düzeyinde ve olay düzeyinde metrikler
Bazı istatistikler şunlara dayanır:
Makale düzeyinde sayımlar (ör. medyada yer alma hacmi)
Olay düzeyinde sayılar (ör. ayrı ihlallerin veya olayların sayısı)
Uygun olduğu durumlarda, tekrarlamayı azaltmak için olay düzeyindeki metrikler tercih edilir.
Sayıların ve sıklıkların yorumlanması
“Günlük olaylar” veya “yıllık ihlaller” gibi istatistikler, toplam küresel aktiviteyi değil, bildirilen veya medyada görünen aktiviteyi temsil eder.
Tedarikçi telemetrisi, devlet şikayet sistemleri ve ekonomik tahminler, kapsam ve metodoloji farklılıkları nedeniyle genellikle önemli ölçüde daha yüksek hacimler bildirir. Bu farklılıklar ilgili yerlerde belirtilmiştir.
Sınırlamalar ve dikkat edilmesi gereken hususlar
Doğruluk ve tutarlılık sağlanmaya özen gösterilse de verilerin doğası gereği sınırlamaları vardır:
Tüm olaylar kamuya açıklanmaz veya bildirilmez
Medyada yer alma durumu bölgeye, sektöre ve olayın ölçeğine göre değişir
Bazı kaynaklar erişimi kısıtlar
Sınırdaki durumlarda sınıflandırma hataları meydana gelebilir
Ekonomik kayıp rakamları soruşturmalar ilerledikçe değişebilir
Bu nedenle istatistikler, kapsamlı ölçümler olarak değil, yön göstergeleri olarak yorumlanmalıdır.
Kaynak Dizini
Aşağıdaki numaralı kaynakların her biri, Siber Güvenlik İstatistikleri sayfasında kullanılan üst simge referansına karşılık gelir. Üst simgeler, bu sayfadaki ilgili kaynak girişine doğrudan bağlantı sağlar.
Kaynak 1 Statista – |
|---|
Kaynak 2 Identity Theft |
Kaynak 3 Identity Theft |
Kaynak 4 Verizon – |
Kaynak 5 IBM – |
Kaynak 6 South Korean |
Kaynak 7 Aflac – June |
Kaynak 8 HIPAA Journal – |
Kaynak 9 California Attorney |
Kaynak 10 Iowa Attorney |
Kaynak 11 Rhode Island |
Kaynak 12 Rhode Island |
Kaynak 13 Aflac Newsroom – |
Kaynak 14 HIPAA Journal – |
Kaynak 15 Office of the |
Kaynak 16 Qantas – Information |
Kaynak 17 Qantas Newsroom – |
Kaynak 18 Michigan Attorney |
Kaynak 19 Maine Attorney |
Kaynak 20 California Attorney |
Kaynak 21 University of |
Kaynak 22 Microsoft Digital |
Kaynak 23 WIRED – NotPetya |
Kaynak 24 Reuters – UnitedHealth |
Kaynak 25 The Guardian – Jaguar |
Kaynak 26 NBC News – |
Kaynak 27 Delaware Department |
Kaynak 28 Cybersecurity |
Kaynak 29 JumpCloud – Phishing |
Kaynak 30 Hornetsecurity – Email |
Kaynak 31 Spearshield – |
Kaynak 32 APWG – Phishing |
Kaynak 33 arXiv – Academic |
Kaynak 34 DeepStrike – Password |
Kaynak 35 NordPass – Top 200 |
Kaynak 36 Financial Times – |
Kaynak 37 SecurityScorecard – |
Kaynak 38 National Technology & |
Kaynak 39 Palo Alto Networks – |
Kaynak 40 IBM – Threat |
Kaynak 41 Tenable – |
Kaynak 42 Cybersecurity |
Kaynak 43 Statista Market |
Kaynak 44 Statista – Cost of |
Kaynak 45 FTC – Consumer |
Kaynak 46 FBI IC3 – 2024 Internet |
Kaynak 47 Kroll – Data Breach |
Kaynak 48 IBM – Cost of a Data |
Kaynak 49 SailPoint – 2024 |
Kaynak 50 DeepStrike – |
Kaynak 51 Proofpoint & |
Kaynak 52 Check Point – |
Kaynak 53 Thales – 2024 |
Kaynak 54 Cyfirma – Energy & |
Kaynak 55 World Economic |
Kaynak 56 DeepStrike – Cyber |
Kaynak 57 Devolutions – State of |
Kaynak 58 TotalAssure – |
Kaynak 59 Cisco – Cybersecurity |
Kaynak 60 IANS Research – |
Kaynak 61 Munich Re – |
Kaynak 62 Gartner – 2025 |
Kaynak 63 Forrester – 2024 |
Kaynak 64 Ivanti – State of |
Kaynak 65 U.S. Department of |
Kaynak 66 U.S. Department of |
Kaynak 67 Google Cloud – |
Kaynak 68 Gartner – Generative AI |
Kaynak 69 Splashtop – Top |
Kaynak 70 ENISA – Threat |