LLM drošības testēšana un MI pārvaldības atbilstība

// Kā tas darbojas

Principiāls testēšanas ietvars

Mūsu metodika seko strukturētai ķēdei Principi → Rezultāti → Procesi → Pierādījumi — tā pati pieeja, kas ir Singapūras AI Verify un ES MI akta atbilstības prasību pamatā.

01

Principi

Visaptveroši pārvaldības apsvērumi, kuriem jūsu MI lietojumprogrammai jāatbilst — atvasināti no AI Verify, NIST AI RMF, ISO 42001 un ES MI akta.

02

Rezultāti

Izmērāmi rezultāti, kas definēti katram principam, aptverot gan tehniskos testus, gan netehniskās procesu pārbaudes (politikas, dokumentācija, pārvaldība).

03

Procesi

Praktiski testēšanas procesi: publisko etalonu pamatlīnijas, nozarei specifiski pielāgoti testi, komponentu līmeņa pārbaudes un manuālas sarkanās komandas sesijas.

04

Pierādījumi

Katrs process validēts ar dokumentāriem pierādījumiem — testu žurnāli, etalonu rezultāti, sarkanās komandas ziņojumi —, veidojot jūsu audita pēdas regulatīvajai atbilstībai.

// Tvērums

Testēti 11 MI pārvaldības principi

Katrs novērtējums aptver visus 11 principus. Katrs tiek novērtēts (Jā / Nē / N/P) ar pierādījumiem un novēršanas ieteikumu, ja konstatētas nepilnības.

1 Pārredzamība Vai lietotāji var saprast, ko MI dara, kā tas pieņem lēmumus un kādi ir tā ierobežojumi?

2Izskaidrojamība

3Atkārtojamība / reproducējamība

4Drošums

5Drošība

6Robustums

7Taisnīgums

8Datu pārvaldība

9Atbildība

10Cilvēka rīcībspēja un uzraudzība

11Iekļaujoša izaugsme un sabiedrības labklājība

// Izvaddatu testēšana

Četras izvaddatu riska jomas

Mēs veicam pamatlīnijas testus (publiskās etalondatu kopas) un specifiskos testus (nozari pārzinoši scenāriji + sarkanās komandas pārbaudes) četrās galvenajās izvaddatu riska jomās, kā arī komponentu līmeņa pārbaudes RAG, filtriem un sistēmas uzvednēm.

💬

Halucinācija

Faktiski nepareiza, nepamatota vai nepilnīga satura ģenerēšana, kas augsta riska kontekstos var maldināt lietotājus.

Pamatlīnijas testi

MMLU — 15 000+ jautājumu 57 jomās
SimpleQA — 4 000+ īso faktu pārbaužu
FACTS Grounding — 1 700+ RAG precizitātes uzvedņu
CNN/DailyMail — 300K+ kopsavilkumu pilnīgums

Specifiskie testi

Nozarei specifiska faktu precizitāte jūsu lietojuma jomā
RAG pamatotība pretinieka dokumentu ievadīšanas apstākļos
Nepilnīguma un selektīvas izlaišanas atklāšana

⚠️

Nevēlams saturs

Kaitīga, toksiska vai juridiski aizliegta satura ģenerēšana — ieskaitot kultūras un vietējo juridisko kontekstu.

Pamatlīnijas testi

MLCommons AILuminate — 900 uzvednes, 9 kaitējuma kategorijas
XSTest — 250 drošu + 200 nedrošu atteikumu kalibrēšana

Specifiskie testi

Lietojuma gadījumam specifiski kaitējuma scenāriji
Kultūras normu un Baltijas/ES juridiskā atbilstība
Toksiskums mērķa valodās (LV, LT, ET, EN, RU)

Komponentu testi

Ievaddatu/izvaddatu filtru viltus negatīvie un viltus pozitīvie rezultāti

🔒

Datu atklāšana

Neparedzēta personas, organizācijas vai konfidenciālas informācijas noplūde — ieskaitot VDAR 9. panta kategorijas.

Pamatlīnijas testi

MLC AILuminate privātuma apakškopa — 100 PII izgūšanas uzvednes
XSTest personas informācija — 75 droši/nedroši izgūšanas scenāriji

Specifiskie testi

Vietējo tiesību jutīgums (VDAR, Baltijas datu likumi)
Iekšējā vs ārējā lietotāja konteksta atklāšanas sliekšņi

Komponentu testi

Sistēmas uzvednes konfidencialitāte un zināšanu bāzes PII noplūde caur RAG

🎯

Pretinieka uzvedņu uzbrukumi

Uzņēmība radīt nedrošus izvaddatus, saskaroties ar tīši izstrādātiem uzvedņu uzbrukumiem, kas paredzēti aizsardzības mehānismu apiešanai.

Pamatlīnijas testi

CYBERSECEVAL 4 — 15 uzvednes ievadīšanas riska varianti
Microsoft BIPIA — 600K+ teksta un koda uzbrukuma uzvednes

Specifiskie testi

Mērķtiecīgi pretinieka scenāriji, pielāgoti jūsu draudu modelim
Netieša ievadīšana caur dokumentiem, e-pastiem, tīmekļa saturu
Izturība pret apiešanu: lomu spēle, hipotētiski, kodēšanas apiešana

Komponentu testi

Ievaddatu filtra apiešana, sistēmas uzvednes pārrakstīšana, vairāku gājienu noturība

// Rezultāts

Ko jūs saņemat:
MI drošības kopsavilkuma ziņojumu

Katrs projekts noslēdzas ar strukturētu MI drošības kopsavilkuma ziņojumu — novērtētu, ar pierādījumiem pamatotu atbilstības dokumentu, kas piemērots iekšējai pārvaldībai, valdes līmeņa ziņošanai, korporatīvo klientu uzticamības pārbaudei un regulatīvajām iesniegšanām.

✓Kopējais vērtējums 104 procesu pārbaudēs (Jā / Nē / N/P ar pierādījumiem)

✓Katra principa izpildes rādītājs visiem 11 pārvaldības principiem

✓Etalonu rezultāti: veiktie, izturētie, neizturētie un izlaistie testi katram principam

✓Prioritizēti ieteikumi katras konstatētās nepilnības novēršanai

✓Ietvaru saskaņojums: Hiroshima CoC, NIST AI RMF, ES MI akta apzīmējumi

✓Neatkarīgs apliecinājuma paziņojums: mūsu formālais viedoklis par jūsu MI sistēmas drošības stāvokli

Pieprasīt parauga ziņojumu →

MI drošības kopsavilkuma ziņojums

Cyberfort • 2026

104

Procesu pārbaudes

69

Jā

22

Nē

13

N/P

1. Pārredzamība

72%

2. Izskaidrojamība

85%

4. Drošums

60%

5. Drošība

90%

8. Datu pārvaldība

55%

// Cenas

Novērtējuma paketes

Fiksēta apjoma, fiksētas cenas projekti. Piegādāti attālināti ar neobligātām klātienes sesijām klasificētām vai izolētām (air-gapped) sistēmām.

Essential

€6 500

Viena LLM lietojumprogramma vai tērzēšanas robots

Novērtēti visi 11 pārvaldības principi
Pamatlīnijas etalonu testi (publiskās datu kopas)
Automatizēta ievainojamību skenēšana
Aptvertas 4 izvaddatu riska jomas
Rakstisks kopsavilkuma ziņojums
30 min pārrunu zvans

📅 2–3 nedēļu piegāde

Sākt novērtējumu →

Professional

Populārākā

€14 000

Sarežģīta lietojumprogramma vai daudzkomponentu sistēma

Novērtēti visi 11 pārvaldības principi
Pamatlīnijas + nozarei specifiski pielāgoti testi
Manuālas sarkanās komandas pārbaudes (3 dienas)
RAG, sistēmas uzvednes un filtru komponentu testēšana
Etalonsertifikācijas pakete
Pilns kopsavilkuma ziņojums + apliecinājuma paziņojums
VDAR / ES MI akta pienākumu kartēšana
Pusdienas atklājumu darbnīca

📅 3–5 nedēļu piegāde

Sākt novērtējumu →

Enterprise

Pielāgota

MI portfelis, valsts sektors vai regulēta nozare

Vairāku sistēmu portfeļa novērtējums
Pielāgota daudzvalodu etalonu izstrāde
Paplašināta sarkanā komanda (2+ nedēļas)
Klātienes testēšanas iespēja
Savstarpēja ietvaru kartēšana (AI Verify, ISO 42001, NIS2)
Valdes līmeņa vadības ziņojums
Regulatīvās iesniegšanas sagatavošana
Veltīts projekta vadītājs

📅 Atkarīgs no apjoma

Apspriest apjomu →

// Sākt

Uzziniet precīzi, kāds ir jūsu LLM lietojumprogrammas stāvoklis.

Rezervējiet bezmaksas 60 minūšu apjoma zvanu. Bez saistībām — mēs novērtēsim jūsu sistēmu, noteiksim augstākā riska nepilnības un ieteiksim pareizo paketi.

Rezervēt bezmaksas apjoma zvanu → Pieprasīt parauga ziņojumu

Atbilde 1 darba dienas laikā • [email protected]

LLM drošības testēšanaun MI pārvaldības atbilstība

Principiāls testēšanas ietvars

Principi

Rezultāti

Procesi

Pierādījumi

Testēti 11 MI pārvaldības principi

Četras izvaddatu riska jomas

Halucinācija

Nevēlams saturs

Datu atklāšana

Pretinieka uzvedņu uzbrukumi

Ko jūs saņemat:MI drošības kopsavilkuma ziņojumu

Novērtējuma paketes

Uzziniet precīzi, kāds ir jūsu LLM lietojumprogrammas stāvoklis.

LLM drošības testēšana
un MI pārvaldības atbilstība

Ko jūs saņemat:
MI drošības kopsavilkuma ziņojumu