Kyberturvallisuustilastot:
menetelmät ja lähteet

Tämän sivun tarkoitus

Tällä sivulla kerrotaan, miten kyberturvallisuustilastomme ovat kerätty sekä miten niitä käsitellään ja tulkitaan. Sivulla ilmoitetaan avoimesti kaikki viitatut tietolähteet. Kyberturvallisuustilastojen pääsivulla esitellään tiivistetyt havainnot ja NordVPN:n tutkimustulokset.

Tietolähteet ja lähdeviitteet

Lähteiden kerääminen suoritetaan Google Custom Search APIn (GCS) kautta käyttäen useita mukautettuja hakukoneita (CSE), jotka on määritetty seuraavasti:

tiedotusvälineet: 44 valtavirran ja teknologia-alan tiedotusvälinettä (esim. BBC, CNN, The New York Times, WSJ, FT, Reuters, Bloomberg, TechCrunch, Wired, Ars Technica, Time ja Forbes).
luotettavat/viitesivustot: 25 alakohtaista lähdettä ja asiantuntijalähdettä (esim. CISA, KrebsOnSecurity, The Hacker News, Dark Reading, BleepingComputer, SecurityWeek ja Infosecurity Magazine).
paikallisuutiset: yli sata alueellista ja kansallista julkaisua APAC- ja EMEA-alueilla ja Amerikassa (esim. Channel NewsAsia, CSA.gov.sg, Zaobao; HK01, unwire.hk; Japan Times, NISC, JPCERT ja ITMedia).
rajoittamaton/yleinen.

Haut perustuvat avainsanoihin, jotka on poimittu ylläpidettävästä avainsanaluettelosta, jossa termit on ryhmitelty luokittain.

Kaikki tietueet sisältävät nimenomaisen lähdeviittauksen:

Alkuperäisen artikkelin linkki
Tiedotusväline (URL-osoitteesta poimittu verkkotunnus)
Julkaisu- ja keräyspäivä

Yhdistämme tietoja monista lähteistä, jotta tilastot ja tapahtumat voidaan koota; kukin tilasto on johdettu artikkelitasoisesta todistusaineistosta, joka on tallennettu linkkeinä.

Sisällön haku ja keräämisen tiheys

Hakee koko tekstin sisällön löydetyistä linkeistä seuraavista lähteistä:

Ensisijainen: NewsPlease
Varavaihtoehto: suora HTML-lataus kovennettujen pyyntöjen istunnolla ja trafilatura-poiminnalla.

Aikakatkaisuja, uudelleenyrityksiä, TLS-varavaihtoehtoja ja referer-otsikoita käytetään väliaikaisten virheiden vähentämiseksi.

Julkaisupäivä ja otsikko otetaan poimijasta, jos ne ovat saatavilla; päivämäärän jäsentäminen normalisoidaan pelkäksi päivämääräksi.

Päivittäiset ajot hakevat edellisen päivän sisältöä.

Piirteiden poiminta

Poimittuihin kenttiin kuuluvat:

Tiedotusväline (URL-osoitteesta)
Ensimmäinen kappale (ensimmäiset 3–5 virkettä)
Avainsanojen ominaisuudet: kokonaismäärä tekstissä, esiintyminen otsikossa, avainsanan sisältävät lauseet ja ylläpidettyyn luetteloon kuuluvat sanat
Sanamäärä

LLM:n suorittama relevanssin arviointi

LLM arvioi jokaisen artikkelin deterministisellä asetuksella (lämpötila 0) ja rajatulla kehotteella, joka edellyttää eksplisiittisiä ja jäsenneltyjä tulosteita:

1. Liittyykö artikkeli kyberturvallisuustapahtumaan?

2. Jos artikkeli on relevantti, määritetään sille korkean luokan tapahtumatyyppi:

Poikkeama: vahvistettu kyberhyökkäys tai tietomurto on jo tapahtunut (esim. kiristyshaittaohjelman käyttö, hajautettu palvelunesto tai järjestelmän vaarantuminen).
Tietoturva-aukko: ohjelmistosta, laitteistosta tai järjestelmistä on kerätty tai paljastunut tietoturva-aukko, jota voitaisiin käyttää hyväksi (kyseessä on mahdollinen riski, ei vahvistettu tietoturva-aukon hyväksikäyttö).
Uhkatiedustelu: uhkatoimijoista, työkaluista, TTP:istä ja kampanjoista laadittu raportti, jossa ensisijaisesti vastataan kysymyksiin ”kuka/ketkä/miten”, eikä keskitytä tiettyyn poikkeaman kohteeksi joutuneeseen uhriin.
Sääntely ja laki: lait, asetukset, täytäntöönpanotoimet, tuomioistuinten päätökset tai merkittävät käytäntöjen muutokset, jotka vaikuttavat kyberturvallisuusvelvoitteisiin.

Artikkelin tyyppi ja luokittelu

Relevantit artikkelit luokitellaan jäsennellysti taksonomian kehotteiden mukaisesti (ensisijaiset: hyökkäyksen tila, tapahtuman tyyppi, sääntely/laki; toissijaiset: vaikutuksen mittarit/luokka, tekniset tiedot, toimialat, maantiede, koko ja arvioidut vahingot).

Tapahtumien ryhmittely (artikkelien koonti tapahtumaksi)

Tavoite: ryhmitellä samaa poikkeamaa käsittelevät artikkelit yhdeksi ”tapahtumaksi”.

Menetelmä:

Nouda tapahtumia tietokannasta kontekstin tarjoamiseksi (otsikot, tunnetut kohteeksi joutuneet organisaatiot, uhkatekijät ja linkit).
LLM vertaa kunkin potentiaalisen artikkelin (artikkelin tyyppi = yksittäinen poikkeama) tietoja edeltäviin tapahtumajoukkoihin ja joko:

1. määrittää valmiin tapahtumatunnuksen, kun osumasta on suuri varmuus, tai

2. muussa tapauksessa luo uuden tapahtuman.

Kehotteissa korostetaan tarkkuutta: linkitä edeltävään tapahtumaan vain, kun siitä on suuri varmuus. Kohteeksi joutuneita organisaatiota ja uhkatoimijoiden signaaleja pidetään vahvoina indikaattoreina.

Tapahtumilla on kootut kentät: ensimmäisen/viimeisen lukukerran päivämäärät, artikkelien määrä, kohteeksi joutuneet organisaatiot, uhkatoimijat, otsikot ja linkit.

Tarkkuus ja laadunvarmistus

Determinismi ja rajoitukset:

LLM:n lämpötilaksi on asetettu 0 determinismin maksimoimiseksi ja hallusinaatioiden vähentämiseksi.
Rajoitetut kehotteet edellyttävät eksplisiittisiä kenttiä ja JSON-tulosteita; jäsentäminen varmistaa skeeman noudattamisen.
Artikkelit, joissa ei ole sisältöä (otsikko/teksti puuttuu), hylätään varhaisessa vaiheessa.

LLM:n ohjaamat ja skeemavalidoidut mittarit:

Kaikki mittarien kentät tuotetaan deterministisillä LLM-ajoilla (lämpötila 0) tiukkojen, dokumentoitujen ohjeiden ja JSON-skeemojen mukaisesti; vain skeemaa noudattavat tulosteet lasketaan mukaan, ja ihmisen määrajoin suorittama laadunvarmistus kalibroi tulokset ja estää häiriöt.

Tapahtumien/artikkeleiden luokittelu tarkkaa suodatusta varten:

Tapahtumatyypin ja artikkelin painopisteen luokittelu toimii tiukkana suodattimena relevanssille. Sen avulla saadaan karsittua aiheesta poikkeavaa, tarpeetonta tai kertausta muistuttavaa sisältöä. Keskittymällä yksittäisten poikkeamien raportointiin voidaan mitattavasti vähentää virheitä ja parantaa tietoaineiston tarkkuutta.

Monilähteinen validointi:

Tapahtumien ryhmittely viittaa aiemmin tallennettuun tapahtumakontekstiin; yhteensopimattomuudet vähentävät virheellisen yhdistämisen mahdollisuutta.
Koonnit sisältävät luettelon tapahtumakohtaisista lähdelinkeistä manuaalista varmennusta varten.

Ihminen osana prosessia:

Vaikutuksiltaan laajat tai epäselvät tapaukset voidaan merkitä toimituksellista arviointia ja faktantarkistusta tarvitseviksi.
Säännölliset laadunvarmistukseen kuuluvat arvioinnit: otantaan kuuluvat artikkelit ja tapahtumat auditoidaan kuukausittain, ja arvioinnissa tarkistetaan kaikki häiriöitä aiheuttavat kehotteet/mallit tai mahdolliset mukautukset avainsanoihin.

Jäljitettävyys:

Jokainen tilasto voidaan jäljittää tietokannassa oleviin artikkeleihin ja linkkeihin auditoinnin edellystysten täyttämiseksi.

Rajoitukset

Kattavuuden rajoitukset:

GCS-pohjainen tiedonkeruu riippuu avainsanoista ja CSE-määrityksestä; kaikkia poikkeamia ei tallenneta, etenkin jos ne eivät kuulu määriteltyihin kieliin tai ovat maksumuurilla rajoitettua sisältöä.
Jotkin sivustot estävät automaattisen tiedon hakemisen; tällaiset artikkelit voivat puuttua osittain tai kokonaan.

Erityisesti LLM:ää koskevat riskit:

Deterministisistä asetuksista ja jäsennellyistä kehotteista huolimatta luokitteluvirheitä voi tapahtua, erityisesti suppeiden tai monitulkintaisten tekstien kohdalla.
Tapahtumien ryhmittely voi jakaa saman poikkeaman useiksi tapahtumiksi tai rajatapauksissa yhdistää samankaltaisia mutta erillisiä tapahtumia.

Miten tilastot lasketaan?

Artikkelitason kentät johdetaan suorasta poiminnasta ja LLM-tulosteista (tallennetaan tietueittain).

Tapahtumatason mittarit kokoavat artikkelien osat event_id:n mukaan:

artikkelien lukumäärä, ensimmäinen/viimeinen lukupäivä
poistetut päällekkäisyydet kohteeksi joutuneista organisaatioista ja uhkatoimijoista
edustavat otsikot ja kanoniset linkkiluettelot

Raporttien tilastot haetaan näistä tallennetuista taulukoista; jokainen luku voidaan jäljittää tapahtumariveihin ja taustalla oleviin artikkelitietueisiin.

Tietojen laajuus

Kyberturvallisuutta käsittelevässä sisällössämme mainitut tilastot ja havainnot on saatu seuraavista lähteistä:

Kyberturvallisuuspoikkeamien julkiset raportit
Mediassa julkaistut jutut vahvistetuista kyberhyökkäyksistä
Toimialan raportit ja tutkimukset
Julkishallinnon ja sääntelyviranomaisten julkistamat tiedot

Tiedot kuvastavat julkisesti havaittavaa ja raportoitua toimintaa, eivät kaikkia maailmanlaajuisesti tapahtuvia kyberhyökkäyksiä. Monet kyberhyökkäykset eivät koskaan käy ilmi, niitä ei raportoida tai niitä ei käsitellä mediassa.

Tietolähteet ja tiedonkeruu

Lähdetyypit

Kyberturvallisuuteen liittyvät artikkelit ja raportit on kerätty useista eri lähteistä, joihin kuuluvat:

Valtavirtaa edustava ja teknologiaa käsittelevä media.
Esimerkiksi suuret kansainväliset uutisorganisaatiot ja teknologiajulkaisut.
Arvovaltaiset ja asiantuntevat kyberturvallisuutta käsittelevät lähteet.
Mukaan lukien valtion viranomaiset, kyberturvallisuuden tutkimusorganisaatiot ja vakiintuneet alan julkaisut.
Alueelliset ja paikalliset uutistoimistot.
Uutiset, joissa aiheena ovat kyberturvallisuusuhat Pohjois-Amerikassa, Euroopassa, Aasian ja Tyynenmeren alueella sekä muilla alueilla.
Toimialaa koskevat raportit ja tutkimusraportit.
Mukaan lukien vuosittaiset raportit tietomurroista, uhkaympäristöä käsittelevät raportit, kyselyt ja taloudelliset analyysit.

Jokainen lähde mainitaan artikkelin tai raportin tasolla siten, että myös julkaisupäivä, julkaisukanava ja alkuperäinen URL-osoite ovat nähtävillä.

Tiedonkeruuprosessi

Sisällön tiedonkeruu toteutetaan automaattisilla hauilla, jotka perustuvat ylläpidettyyn kyberturvallisuuden avainsanaluetteloon. Avainsanat on ryhmitelty aiheittain (esimerkiksi tietomurrot, kiristyshaittaohjelmat, tietojenkalastelu, tietoturva-aukot, sääntely).

Hakuja suoritetaan päivittäin uusien julkaisujen hyödyntämiseksi. Jokaisella ajolla haetaan vain tuoretta materiaalia, mikä varmistaa, että tietoaineisto on ajankohtaisen raportoinnin mukaista.

Sisällön kerääminen ja käsittely

Artikkelin nouto

Kun lähde on löydetty, artikkelin koko teksti noudetaan automaattisilla poimintatyökaluilla. Jos ensisijainen poiminta epäonnistuu, käytetään varamenetelmiä laajan kattavuuden varmistamiseksi.

Päällekkäisyyksien poisto

Kaksinkertaisen laskennan välttämiseksi:

Identtiset URL-osoitteet käsitellään vain kerran
Uudelleenjulkaistu tai syndikoitu sisältö tarkistetaan mahdollisten päällekkäisyyksien varalta artikkelitasolla
Tapahtumatasoinen koonti (kuvattu alla) vähentää eri julkaisukanavien välisiä päällekkäisyyksiä entisestään

Relevanssin mukainen suodatus ja luokittelu

Relevanssin arviointi kyberturvallisuuden kannalta

Jokainen artikkeli arvioidaan sen määrittämiseksi, onko se relevantti kyberturvallisuustilastojen kannalta. Artikkeleissa on merkityksellisesti kuvattava tai analysoitava kyberturvallisuuteen liittyvää tapahtumaa, uhkaa, tietoturva-aukkoa tai sääntelytoimea.

Tapahtumatyypin luokittelu

Relevantit artikkelit on luokiteltu pääluokkiin, joihin kuuluvat:

Poikkeama – vahvistettu kyberhyökkäys tai tietomurto, joka on jo tapahtunut
Tietoturva-aukko – paljastunut tietoturva-aukko, jota voitaisiin käyttää hyväksi
Uhkatiedustelu – raportointi uhkatoimijoista, työkaluista, kampanjoista tai tekniikoista
Sääntely/lainsäädäntö – kyberturvallisuuteen liittyvät lait, täytäntöönpanotoimet, käytäntöjen muutokset tai oikeudenkäyntimenettelyt

Tämä luokittelu varmistaa, että ”poikkeamiin”, ”tietomurtoihin” tai ”hyökkäyksiin” viittaavia tilastoja ei sekoiteta paljastuneisiin tietomurtoihin tai yleiseen aiheen käsittelyyn.

Tapahtumien ryhmittely (artikkelien koonti tapahtumaksi)

Useissa artikkeleissa kerrotaan usein samasta taustalla vaikuttavasta kyberhyökkäyksestä. Ylilaskennan estämiseksi:

Samaa poikkeamaa käsittelevät artikkelit on ryhmitelty yhdeksi tapahtumaksi
Tapahtumille annetaan pysyvät sisäiset tunnisteet
Artikkelit linkitetään olemassa oleviin tapahtumiin vain, jos ne suurella varmuudella käsittelevät samaa tapahtumaa

Ryhmittelyssä käytettäviin indikaattoreihin kuuluvat kohteeksi joutuneet organisaatiot sekä uhkatoimijat, aikajänteet ja poikkeamien kuvaukset.

Tapahtumatasoiset tietueet sisältävät:

Ensimmäisen ja viimeisen esiintymispäivän
Aiheeseen liittyvien artikkelien määrän
Kohteeksi joutuneet organisaatiot
Mainitut uhkatoimijat
Varmennettavat lähdelinkit

Automatisoidun analyysin ja laadunvalvonnan käyttö

Automatisoitu luokittelu

Luokittelussa, poiminnassa ja koonnissa käytetään jäsenneltyä, determinististä kielimallianalyysiä. Kaikki automatisoidut tulosteet noudattavat ennalta määriteltyjä skeemoja yhdenmukaisuuden varmistamiseksi.

Mallit toimivat deterministisillä asetuksilla vaihtelun vähentämiseksi ja hallusinaatioiden riskin madaltamiseksi.

Laadunvarmistus

Tarkkuuden ylläpitämiseksi:

Skeeman validointi varmistaa, että vain oikein jäsennellyt tulokset lasketaan mukaan
Kuukausittain suoritetaan säännöllisesti otanta- ja tarkastusmenettelyt, mukaan lukien tarkkuuden tarkastus, jotta luokittelun mahdolliset häiriöt voidaan havaita. Tässä tarkastuksessa tunnistetaan luokittelun muutokset, joiden perusteella malliin tehdään tarvittavat säädöt.
Monitulkintaiset tai vaikutuksiltaan merkittävät tapaukset merkitään ihmisen tarkastettaviksi
Kootuista tilastoista on yhä jäljitettävissä yksittäiset artikkelit ja tapahtumat

Miten tilastot lasketaan?

Artikkelitason ja tapahtumatason mittarit

Osa tilastoista perustuu seuraaviin:

Artikkelitason lukumäärät (esim. medianäkyvyys)
Tapahtumatason lukumäärät (esim. erillisten tietomurtojen tai poikkeamien määrä)

Mahdollisuuksien mukaan tapahtumatasoisia mittareita suositellaan päällekkäisyyksien vähentämiseksi.

Lukumäärien ja esiintymistiheyksien tulkinta

Tilastot, kuten ”päivittäiset poikkeamat” tai ”vuotuiset tietomurrot”, kuvastavat raportoituja tai mediassa näkyviä tapahtumia, eivät kaikkia tapahtumia maailmanlaajuisesti.

Toimittajien telemetriatiedot, viranomaisten valitusjärjestelmien ja talousennusteiden raporteissa mainitaan usein huomattavasti suurempia määriä, mikä johtuu eroista laajuudessa ja menetelmissä. Nämä erot mainitaan tarvittaessa.

Rajoitukset ja huomioitavat seikat

Vaikka tietojen tarkkuuteen ja johdonmukaisuuteen on kiinnitetty huomiota, tietoihin liittyy luontaisia rajoituksia:

Kaikkia poikkeamia ei julkisteta tai raportoida
Medianäkyvyys vaihtelee alueittain, toimialoittain ja poikkeaman laajuuden mukaan
Osa lähteistä rajoittaa niiden käyttöä
Luokitteluvirheitä voi esiintyä rajatapauksissa
Taloudellisten tappioiden luvut voivat muuttua tutkimusten edetessä

Tilastoja on siis pidettävä suuntaa antavina indikaattoreina, ei tyhjentävinä tuloksina.

Lähdehakemisto

Jokainen alla oleva numeroitu lähde vastaa yläindeksillä merkittyä viitettä, jota käytetään Kyberturvallisuustilastot-sivulla. Yläindeksit linkittävät suoraan tältä sivulta löytyvään relevanttiin lähdeviitteeseen.

Lähde ¹ Statista – Cybercrime worldwide Linkki⁠‌
Lähde ² Identity Theft Resource Center (ITRC) – Weekly Breach Breakdown Q3 2025 Linkki⁠‌
Lähde ³ Identity Theft Resource Center (ITRC) – H1 2025 Data Breach Analysis Linkki⁠‌
Lähde ⁴ Verizon – Data Breach Investigations Report (DBIR) 2025 Linkki⁠‌
Lähde ⁵ IBM – Cost of a Data Breach Report 2025 Linkki⁠‌
Lähde ⁶ South Korean Ministry of Science and ICT – SK Telecom data exfiltration incident Linkki⁠‌
Lähde ⁷ Aflac – June 2025 security incident regulatory filing Linkki⁠‌
Lähde ⁸ HIPAA Journal – Largest healthcare data breaches of 2025 Linkki⁠‌
Lähde ⁹ California Attorney General – Aflac breach report (SB24-616010) Linkki⁠‌
Lähde ¹⁰ Iowa Attorney General – Aflac data breach notification Linkki⁠‌
Lähde ¹¹ Rhode Island Attorney General – Data‑breach notifications Linkki⁠‌
Lähde ¹² Rhode Island AG – Data‑breach notification Linkki⁠‌
Lähde ¹³ Aflac Newsroom – June 2025 security incident update Linkki⁠‌
Lähde ¹⁴ HIPAA Journal – Aflac data breach article Linkki⁠‌
Lähde ¹⁵ Office of the Australian Information Commissioner – Statement on Qantas cyber incident Linkki⁠‌
Lähde ¹⁶ Qantas – Information for customers on cyber incident Linkki⁠‌
Lähde ¹⁷ Qantas Newsroom – Update on Qantas cyber incident (9 July 2025) Linkki⁠‌
Lähde ¹⁸ Michigan Attorney General – Consumer alert on data breaches (TransUnion) Linkki⁠‌
Lähde ¹⁹ Maine Attorney General – Allianz Life cyber incident notice Linkki⁠‌
Lähde ²⁰ California Attorney General – Allianz data breach report (SB24-612078) Linkki⁠‌
Lähde ²¹ University of Maryland – Cyber Security Statistics Linkki⁠‌
Lähde ²² Microsoft Digital Defense Report 2023 Linkki⁠‌
Lähde ²³ WIRED – NotPetya cyberattack article Linkki⁠‌
Lähde ²⁴ Reuters – UnitedHealth tech unit hack article Linkki⁠‌
Lähde ²⁵ The Guardian – Jaguar Land Rover hack article Linkki⁠‌
Lähde ²⁶ NBC News – MGM Resorts cyberattack cost article Linkki⁠‌
Lähde ²⁷ Delaware Department of Technology & Information – eSecurityNews (Oct 2023) Linkki⁠‌
Lähde ²⁸ Cybersecurity Ventures – Global ransomware damage cost projection Linkki⁠‌
Lähde ²⁹ JumpCloud – Phishing attack statistics Linkki⁠‌
Lähde ³⁰ Hornetsecurity – Email threats in 2024 Linkki⁠‌
Lähde ³¹ Spearshield – Click‑to‑credential phishing study Linkki⁠‌
Lähde ³² APWG – Phishing Activity Trends Reports Linkki⁠‌
Lähde ³³ arXiv – Academic password/credential research (2025) Linkki⁠‌
Lähde ³⁴ DeepStrike – Password statistics 2025 Linkki⁠‌
Lähde ³⁵ NordPass – Top 200 Most Common Passwords Linkki⁠‌
Lähde ³⁶ Financial Times – Supply‑chain cybersecurity article Linkki⁠‌
Lähde ³⁷ SecurityScorecard – 2025 Supply Chain Cybersecurity Trends Linkki⁠‌
Lähde ³⁸ National Technology & Security Coalition – 2025 Software Supply Chain Security Report Linkki⁠‌
Lähde ³⁹ Palo Alto Networks – State of Cloud Native Security Linkki⁠‌
Lähde ⁴⁰ IBM – Threat Intelligence Report Linkki⁠‌
Lähde ⁴¹ Tenable – Cloud Security Risk Report 2025 Linkki⁠‌
Lähde ⁴² Cybersecurity Ventures – Cybersecurity Cost Report Linkki⁠‌
Lähde ⁴³ Statista Market Insights – Estimated cost of cybercrime worldwide 2018‑2029 (ResearchGate) Linkki⁠‌
Lähde ⁴⁴ Statista – Cost of cybercrime worldwide forecast Linkki⁠‌
Lähde ⁴⁵ FTC – Consumer Sentinel Network Data Book 2024 Linkki⁠‌
Lähde ⁴⁶ FBI IC3 – 2024 Internet Crime Report Linkki⁠‌
Lähde ⁴⁷ Kroll – Data Breach Outlook 2025 Linkki⁠‌
Lähde ⁴⁸ IBM – Cost of a Data Breach 2024: Financial Industry Linkki⁠‌
Lähde ⁴⁹ SailPoint – 2024 State of Identity Security in Financial Services Linkki⁠‌
Lähde ⁵⁰ DeepStrike – Healthcare data breach statistics 2025 Linkki⁠‌
Lähde ⁵¹ Proofpoint & Ponemon – Healthcare Cybersecurity Report Linkki⁠‌
Lähde ⁵² Check Point – Cyber Security Report 2025 Linkki⁠‌
Lähde ⁵³ Thales – 2024 Data Threat Report: Critical Infrastructure Edition Linkki⁠‌
Lähde ⁵⁴ Cyfirma – Energy & Utilities industry report Linkki⁠‌
Lähde ⁵⁵ World Economic Forum – Global Cybersecurity Outlook 2025 Linkki⁠‌
Lähde ⁵⁶ DeepStrike – Cyber attacks on small businesses Linkki⁠‌
Lähde ⁵⁷ Devolutions – State of IT Security Report 2025 Linkki⁠‌
Lähde ⁵⁸ TotalAssure – Small business cybersecurity statistics 2025 Linkki⁠‌
Lähde ⁵⁹ Cisco – Cybersecurity Readiness Index 2025 Linkki⁠‌
Lähde ⁶⁰ IANS Research – Security budgets press release (2024) Linkki⁠‌
Lähde ⁶¹ Munich Re – Cyber insurance risks and trends 2025 Linkki⁠‌
Lähde ⁶² Gartner – 2025 information security spending forecast Linkki⁠‌
Lähde ⁶³ Forrester – 2024 Cybersecurity Benchmarks (Global) Linkki⁠‌
Lähde ⁶⁴ Ivanti – State of Cybersecurity Report Linkki⁠‌
Lähde ⁶⁵ U.S. Department of Homeland Security – FY 2025 Budget in Brief Linkki⁠‌
Lähde ⁶⁶ U.S. Department of Defense – CYBERCOM Budget Justification Linkki⁠‌
Lähde ⁶⁷ Google Cloud – Cybersecurity forecast Linkki⁠‌
Lähde ⁶⁸ Gartner – Generative AI attack survey (Sep 22 2025) Linkki⁠‌
Lähde ⁶⁹ Splashtop – Top cybersecurity trends and predictions for 2026 Linkki⁠‌
Lähde ⁷⁰ ENISA – Threat Landscape 2024 Linkki⁠‌

Kyberturvallisuustilastot: menetelmät ja lähteet

Tämän sivun tarkoitus

Tietojen laajuus

Tietolähteet ja tiedonkeruu

Lähdetyypit

Tiedonkeruuprosessi

Sisällön kerääminen ja käsittely

Artikkelin nouto

Päällekkäisyyksien poisto

Relevanssin mukainen suodatus ja luokittelu

Relevanssin arviointi kyberturvallisuuden kannalta

Tapahtumatyypin luokittelu

Tapahtumien ryhmittely (artikkelien koonti tapahtumaksi)

Automatisoidun analyysin ja laadunvalvonnan käyttö

Automatisoitu luokittelu

Laadunvarmistus

Miten tilastot lasketaan?

Artikkelitason ja tapahtumatason mittarit

Lukumäärien ja esiintymistiheyksien tulkinta

Rajoitukset ja huomioitavat seikat

Lähdehakemisto

Kyberturvallisuustilastot:
menetelmät ja lähteet