Tolv AI-leverandører har Frontier-sikkerhetsrammer i 2025
Bare tolv AI-leverandører publiserte Frontier-sikkerhetsrammer i 2025, mens 700 millioner bruker tjenestene ukentlig. Her er kravene norske innkjøpere bør stille før kontraktsignering.

Forskjellen på AI-sikkerhet og AI-trygghet
Da Yoshua Bengio kunngjorde International AI Safety Report 2026 i februar, var den bygget på arbeid fra over 100 uavhengige eksperter nominert av over 30 land og internasjonale organisasjoner. Den første utgaven fra 2025 hadde 96 eksperter i samme team. Vi har på to år beveget oss fra et felt drevet av meninger til ett som genererer institusjonell evidens, og norske innkjøpere må holde tritt.
Den viktigste begrepsforvirringen i norske AI-anskaffelser handler om at AI-sikkerhet og AI-trygghet blandes sammen. På engelsk skiller man tydelig mellom safety og security. IBM oppsummerer at AI safety adresserer iboende problemer og utilsiktede konsekvenser, mens AI security beskytter AI-systemer mot eksterne trusler. Du trenger begge dekket i en leverandøravtale, og du må vite hvilken som mangler når en klausul kun lover «sikkerhet».
Hva AI-sikkerhet (safety) faktisk dekker
AI-sikkerhet i den brede engelsk-amerikanske bruken er et tverrfaglig felt for å hindre ulykker, misbruk eller andre skadelige konsekvenser fra AI-systemer. Det dekker alignment, robusthet, overvåkning og systemisk sikkerhet. Galileo definerer det som tekniske praksiser og prinsipper for å sikre at AI-systemer opererer pålitelig, sikkert og som tiltenkt. Det er en bredere kategori enn cyberhygiene.
I akademisk litteratur identifiserer en arXiv-gjennomgang av 383 fagfellevurderte artikler åtte overordnede risikotyper: uønsket atferd, ikke-stasjonære distribusjoner, motstandsangrep, usikker utforskning, manglende kontrollhåndhevelse, systemspesifikasjonsfeil, manglende overvåkning og støy/uteliggere. Gjennomgangen startet med 2 666 artikler fra databasesøk før filtrering, supplert av 117 artikler fra snøballmetoden. Konklusjonen: sikkerhetsfeltet er langt bredere enn den eksistensielle risikodebatten.
Hva AI-trygghet (security) faktisk handler om
AI-trygghet, det vi på engelsk kaller AI security, handler om konfidensialitet, integritet og tilgjengelighet for selve AI-systemet. Cloud Security Alliance kontrasterer dette mot AI safety, som handler om menneskelig velferd, etiske implikasjoner og samfunnsverdier. I norsk språkbruk smelter de to ofte sammen til «AI-sikkerhet», noe som er upresist når kontrakter skal forhandles. En innkjøper som ber om sikkerhet uten å spesifisere hva, får typisk leveranse av security-tiltak: tilgangsstyring, kryptering, logging.
Hvorfor innkjøpere må forstå begge
Når sikkerhet bare betyr security, faller safety-spørsmål ut: kan modellen hallusinere kritiske beslutninger, forsterke skjevheter, lekke treningsdata, gi farlige instruksjoner. En 2024-rapport viser at 44 % av respondentene sa at organisasjonene deres hadde opplevd negative konsekvenser fra bruk av AI. De negative konsekvensene som dominerer, er safety-svikt, ikke security-svikt. Innkjøperen som ikke skiller mellom dem, ender opp med en avtale som dekker halve risikoen.
Tolv selskaper bak Frontier AI Safety Frameworks i 2025
International AI Safety Report 2026 dokumenterer at 12 selskaper publiserte eller oppdaterte Frontier AI Safety Frameworks i 2025. Tallet bekreftes i flere uavhengige gjennomganger av rapporten. Disse rammeverkene er det nærmeste markedet kommer en industri-konsensus om hvordan grunnmodeller skal evalueres før utrulling. Alura behandler dem som minimumsstandard, ikke beste praksis.
Hva en Frontier AI Safety Framework faktisk inneholder
En typisk Frontier-ramme dekker fire ting: terskler for kapasiteter som utløser ekstra testing, hvilke evalueringer som kjøres før en modell slippes, hvilke risikoreduksjoner som aktiveres ved overskridelse, og hvilken intern styring som godkjenner utrulling. CSETs analyse av EUs Code of Practice peker på at slike rammer historisk har vært selskapsdefinerte, med fleksible terskler. EUs Code of Practice strammer dette inn ved å kreve at akseptable risikonivåer defineres på forhånd.
| Komponent i rammeverk | Hva det krever | Hvor det er forankret |
|---|---|---|
| Kapasitetsterskler | Definerte nivåer der ekstra evaluering aktiveres | International AI Safety Report 2026 |
| Pre-deployment-evaluering | Modelltester før lansering, dokumentert | Nemko Digital EU AI Act |
| Risikoreduksjoner | Tiltak som aktiveres ved terskel-overskridelse | CSET Code of Practice |
| Intern godkjenning | Styring og signoff før utrulling | CSET Code of Practice |
Hvem som har publisert eller oppdatert i 2025
Selskapene bak Frontier-rammene er i hovedsak de samme som dominerer grunnmodell-markedet. Frontier Model Forum er et samarbeid mellom Anthropic, Google, Microsoft og OpenAI, etablert nettopp som industriforum for dette formålet. Stanford HAIs 2026 AI Index dokumenterer at 90 % av de ledende frontier-modellene i 2025 ble produsert av industrien, ikke akademia. Det forklarer hvorfor selvregulering har blitt det dominerende sporet, og hvorfor offentlig regulering nå tar igjen.
Listen er offentlig informasjon. Du kan kreve at en leverandør står på den. Hvis de ikke gjør det, skal de forklare hvorfor og dokumentere et alternativ. Center for AI Safety (CAIS) og rapportens eget kilderegister er nyttige referansepunkter når du sjekker leverandørens påstander mot dokumentasjon.
Funnene i International AI Safety Report 2026
International AI Safety Report 2026 er andre utgave av en omfattende vitenskapelig gjennomgang av kapasiteter og risikoer ved generelle AI-systemer. Rapporten er på 221 sider og har rapportnummer DSIT 2026/001. Den gir ingen spesifikke politiske anbefalinger; den syntetiserer vitenskapelig evidens. Det gjør den nyttig som forhandlingsgrunnlag: den kan ikke avfeies som politisk.
Hvem som faktisk står bak rapporten
Rapporten ledes av Turing Award-vinner Yoshua Bengio og bygger på arbeid fra over 100 uavhengige eksperter, inkludert nobelprisvinnere og Turing Award-vinnere, nominert av 30 land. Seksjonen om åpne vektmodeller starter på side 132, og er anmeldt av David Evan Harris. Han bemerker at omfanget i år er innsnevret og ikke inneholder samme nivå av behandling av AI-skjevhet, miljøpåvirkning, personvern og opphavsrett som tidligere utgaver.
Hovedfunnene som påvirker innkjøpere
Rapporten dokumenterer at minst 700 millioner mennesker bruker ledende AI-systemer ukentlig, og at 50 % av befolkningen i noen land bruker AI. Generelle AI-kapasiteter har fortsatt å forbedres, særlig innen matematikk, koding og autonom drift. For en norsk innkjøper betyr volumet at leverandøravtaler nå er kjernerisiko-kontrakter, ikke støtteleveranser.
Rapporten bemerker at åpne vektmodeller letter forskning og innovasjon, men at deres sikkerhetsmekanismer enklere kan fjernes. En LessWrong-gjennomgang viser at det koster rundt 1 % av treningskostnaden å fininnstille bort sikkerhetstiltak, og noen hundre euro å omgå sikkerhetsbarrierer på åpne modeller. Det har direkte implikasjoner for hvilken modell-type du tillater i interne prosesser.
Det «evidence dilemma» rapporten beskriver
Bengio omtaler dette som et evidence dilemma for beslutningstakere: å handle for tidlig risikerer å forankre ineffektive politikk, mens å vente på sterk evidens kan gjøre samfunnet sårbart. Den samme avveiingen gjelder for kontraktsforhandling. Hvis du venter på fullstendig presedens før du krever pre-deployment-testing, har leverandøren allerede skrevet kontrakten. Forskere har uttrykt bekymring for at AI-sikkerhetstiltak ikke holder tritt med den raske utviklingen av AI-kapasiteter. Innkjøpere som speiler den treghet i sine egne avtaler, sitter alene med risikoen.
EUs Code of Practice og minimumsstandarden for risikostyring
Code of Practice er et frivillig verktøy fra European Commission for å hjelpe industrien med å etterleve AI Act. Den ble sluppet 10. juli, og AI Acts regler for GPAI-modeller trer i kraft 2. august 2025. Kombinasjonen gir norske innkjøpere et språk for hva som faktisk skal kreves av en leverandør.
Hva Code of Practice er, og hva den ikke er
Code of Practice er ikke en lov, men en operasjonalisering. Den oversetter de overordnede kravene i AI Act til testbare forpliktelser for tilbydere av generelle AI-modeller. Tilbydere som følger den, antas å oppfylle relevante AI Act-krav. Tilbydere som ikke følger den, må demonstrere etterlevelse på annen måte. For innkjøperen betyr det at fraværet av Code of Practice-tilslutning er et rødt flagg som krever forklaring.
Hvorfor sikkerhetskapitlet hever standarden
CSET beskriver sikkerhetskapitlet som en minimumsstandard for risikostyring som går langt utover dagens praksis. Den krever blant annet at akseptable risikonivåer defineres på forhånd, slik at leverandører ikke kan justere toleransen fleksibelt. Dette fjerner en favoritt-rute for leverandører som vil holde definisjonsmakten over hva som er forsvarlig. For en CTO som forhandler en avtale i 2026, er dette en konkret hjemmel for å låse risikoaksept i kontrakten.
Hvorfor risikoakseptnivå må fastsettes på forhånd
Alura mener at risikoakseptnivå bør fastsettes i kontrakten, ikke styres løpende av leverandøren. Bakgrunnen er enkel: hvis leverandøren beholder retten til å redefinere «akseptabel risiko» når egne tester fanger noe ubehagelig, har du i praksis ingen sikkerhetsgaranti. EUs Code of Practice bekrefter at akseptable risikonivåer må defineres på forhånd, og den samme logikken bør gjelde i privatrettslige avtaler.
Hva predefinerte risikoterskler betyr i praksis
Det betyr at avtalen din inneholder kvantitative grenser: hvor mange falske positive aksepteres, hvilken andel av PII-deteksjon må klare seg gjennom tester, hvilket nøyaktighetstall må toksisitetsdeteksjon levere. Galileo dokumenterer for eksempel at deres toksisitetsdeteksjon oppnår 96 % gjennomsnittlig nøyaktighet på valideringssett, og at toneanalyse oppnår 80 % på GoEmotions valideringssett. Sexismedeteksjon ligger på 83 %. Slike tall, ikke vage adjektiver, hører hjemme i avtalen.
Kontraktsklausuler som låser nivået
Klausulene må gjøre tre ting: definere måleverdiene som benyttes, sette akseptable utfall, og kreve at endringer i risikoaksept utløser reforhandling. Hvis leverandøren leverer en oppdatert modellversjon som faller under terskelen, må det utgjøre kontraktsbrudd, ikke en akseptert oppgradering. Bekymringen om at AI-sikkerhet ikke holder tritt med kapasitetsutviklingen oversettes da til en juridisk hjemmel som faktisk er håndhevbar.
Pre-deployment-testing norske innkjøpere bør kreve
Alura mener at dokumentert pre-deployment-testing må kreves før AI-leverandøravtaler signeres. Pre-deployment-testing er ikke ett enkelt steg, men en pakke av evalueringer som beviser at modellen oppfører seg innenfor de risikotersklene avtalen krever. Nemko beskriver at høyrisiko-AI-systemer må oppfylle strenge krav, inkludert risikostyring, datastyring og menneskelig tilsyn. Pre-deployment-testing er bevisbyrden som ligger bak disse kravene.
Modellevaluering og kapasitetstester
Modellevaluering måler hva modellen kan og ikke kan. Det inkluderer benchmarks for nøyaktighet, kapasiteter og spesifikke domener. For generelle AI-modeller med systemisk risiko er modellevaluering og testing ekstra forpliktelser under AI Act. Norske innkjøpere bør kreve at testresultatene leveres som rådata, ikke bare oppsummeres i et salgsdokument.
Red-teaming og adversarial testing
Adversarial testing tester hva modellen kan tvinges til å gjøre. LessWrong-gjennomgangen bemerker at nåværende alignment-teknikker som RLHF er sprø og kan omgås. Det betyr at en modell som passerer overflate-evalueringer fortsatt kan svikte under press. International AI Safety Report 2026 dokumenterer at kriminelle grupper og statsassosierte aktører aktivt bruker generelle AI-modeller i sine operasjoner. Red-teaming er prøven på om modellen tåler det.
Dokumentasjon og bevisbyrde
Høyrisiko-AI-systemer krever risikostyringssystem, teknisk dokumentasjon, menneskelig tilsyn og registrering i EU-database. Bevisbyrden ligger på leverandøren under AI Act, men kontraktsmessig må du forplikte deg til å motta og oppbevare dokumentasjonen. AI Act har ekstraterritoriell virkning, så ikke-EU-leverandører må overholde reglene når de opererer i EU-markedet. Det dekker både amerikanske og kinesiske grunnmodell-leverandører som norske bedrifter bruker daglig.
| Testtype | Hva den måler | Bevis å kreve |
|---|---|---|
| Modellevaluering | Kapasiteter, nøyaktighet, benchmark-ytelse | Rådata, ikke oppsummering |
| Adversarial og red-team | Hvordan modellen svikter under press | Angrepsklasser dekket, suksessrater |
| Bias og toksisitet | Skjevhet og skadelig output | Validerings-sett, jf. 96 % toksisitetsnøyaktighet |
| PII-håndtering | Lekkasje av personopplysninger | Testresultater per datatype |
| Robusthet | Ytelse under distribusjons-skift | Resultater på robusthet-benchmarks |
Treningsberegning og hvorfor 10^25 FLOPs er terskelen
EUs Code of Practice bruker 10^23 floating-point operations som terskel for å definere GPAI-modeller, og 10^25 FLOPs som terskel for modeller som anses å utgjøre systemiske risikoer. Det er ikke vilkårlige tall. De bestemmer hvilke leverandører som er omfattet av de strengeste forpliktelsene, og dermed hvilke leverandører som faktisk må levere på pre-deployment-krav.
Hva FLOP-grensene faktisk gjør
Treningsberegning er et proxy for kapasitet: jo mer regnekraft brukt på treningen, jo høyere er typisk modellens evne til generell oppgaveløsning. Regnekraft for AI-treninger har vokst eksponentielt siden 2012. EUs valg av to terskler skiller mellom «modell som er omfattet» og «modell som krever ekstra tilsyn». Det er denne distinksjonen norske innkjøpere må kjenne for å vite hvilken leverandør som har hvilke forpliktelser.
Modeller over 10^26 FLOP og hva det betyr
De største treningskjøringene passerte sannsynligvis 10^26 FLOP i 2025, ti ganger over EUs systemiske-risiko-terskel. Når du kjøper tjenester bygget på de største grunnmodellene, kjøper du tjenester fra leverandører som per definisjon er underlagt de strengeste forpliktelsene under AI Act. Krev at de demonstrerer etterlevelse. Stanford HAI bemerker at USA-Kina-gapet i frontier-modell-ytelse effektivt er lukket, så valg av leverandør-jurisdiksjon ikke lenger gir kapasitetsforskjell. Det gir derimot reguleringsforskjell.
Cybertrusler dokumentert gjennom 2025 og 2026
Gjennomganger av 2026-rapporten lister cybertrusler i tall som er vanskelige å bortforklare. AI-systemer oppdaget 77 % av programvaresårbarheter i en konkurranse. Identitetsbaserte angrep økte 32 % første halvår 2025. Dataeksfiltrasjonsvolumer for ti store ransomware-familier økte markant år over år.
AI-drevet automatisering av angrep
En trusselaktør brukte AI-modeller til å automatisere 80 til 90 prosent av innsatsen i et inntrengningsforsøk. Det er en grunnleggende endring i økonomien for målrettede angrep: tidligere kostbart skreddersydd arbeid blir nå rimelig. Norske SMB-er var lenge beskyttet av at de var for små for håndarbeid. Den beskyttelsen forsvinner.
Ransomware og dataeksfiltrasjon
Ransomware-angrep mot industrielle organisasjoner økte 87 % det foregående året. Når AI senker kostnaden ved målidentifisering og innledende kompromittering, flytter angripere seg fra «hvem er sårbar» til «hvem har betalt før». Leverandøravtaler må adressere eksplisitt hva som skjer dersom AI-leverandøren selv blir kompromittert, og hvem som bærer responsen.
AI som forsvar og dobbeltsidigheten
Rapporten fremhever en dobbeltbruks-utfordring i cybersikkerhet: å begrense skadelig bruk uten å bremse defensiv innovasjon. Monitored APIs er en sentral strategi for å hindre misbruk av kraftige AI-modeller. Det skyver oppmerksomheten mot leveransemodellen: en hosted API med overvåkning er noe ganske annet enn åpne vekter som lastes ned og fininnstilles.
| Trussel-måling | Verdi | Implikasjon for innkjøper |
|---|---|---|
| Sårbarhetsdeteksjon av AI | 77 % | Forsvarsverktøy må holde tritt |
| Identitetsangrep H1 2025 | +32 % | MFA er minimumskrav i AI-portaler |
| Ransomware industri YoY | +87 % | Backup og incident-klausuler må strammes |
| Eksfiltrasjon YoY | Markant økning | DLP-krav i AI-integrasjoner |
| Automatisering i angrep | 80 til 90 % | Volum av angrep mot SMB øker |
EU AI Act-tidslinjen frem mot august 2027
Artificial Intelligence Act ble publisert i EUs offisielle tidende 12. juli 2024 og trådte i kraft 1. august 2024. Forordningen har vært i kraft siden august 2024 og får full anvendelse innen 2027. Den dekker 450 millioner mennesker i EU-markedet og 27 EU-medlemsstater. Norge er gjennom EØS i praksis omfattet.
2025-fasen og forbudte praksiser
Fra 2. februar 2025 gjelder Chapter I og II, det vil si generelle bestemmelser og forbudte AI-praksiser. Fra 2. august 2025 gjelder forpliktelser for tilbydere av generelle AI-modeller. Forbudte AI-systemer inkluderer sosial skåring, biometrisk kategorisering basert på sensitive egenskaper, og følelsesgjenkjenning på arbeidsplasser. For HR-tech-innkjøp er den siste særlig viktig.
GPAI-håndhevelse fra 2. august 2026
Fra 2. august 2026 trer Kommisjonens håndhevingsmyndighet for generelle AI-modeller i kraft. Det er denne datoen norske innkjøpere bør planlegge mot. Avtaler signert i 2026 med løpetid forbi denne datoen må allerede nå reflektere kravene. Fra samme dato gjelder Artificial Intelligence Act som helhet, med visse unntak. European Parliament godkjente forenklingstiltak 16. juni 2026 som utsatte enkelte forpliktelser for høyrisiko-AI-systemer.
Høyrisikosystemer i 2027 og 2028
Forpliktelser for frittstående høyrisiko-AI-systemer gjelder fra 2. desember 2027, og 2. august 2028 for AI-systemer innebygd som sikkerhetskomponenter. Forbudet mot AI-systemer som genererer CSAM eller lager ikke-samtykkebaserte intime bilder har frist 2. desember 2026. Tilbydere av generelle AI-modeller som var på markedet før 2. august 2025 har frist 2. august 2027 for å etterleve.
| Dato | Hva trer i kraft |
|---|---|
| 2. februar 2025 | Forbudte praksiser og generelle bestemmelser |
| 2. august 2025 | GPAI-forpliktelser for nye modeller |
| 2. februar 2026 | Kommisjonens guidelines på artikkel 6 |
| 2. august 2026 | Håndheving av GPAI, full anvendelse |
| 2. desember 2026 | Vannmerking og forbud mot nudifier-apper |
| 2. august 2027 | Frist for GPAI på markedet før 2. august 2025 |
| 2. desember 2027 | Frittstående høyrisiko-systemer |
| 2. august 2028 | Innebygde sikkerhetskomponenter |
Bøtenivå og konsekvenser ved manglende etterlevelse
Bøter for manglende etterlevelse kan nå €35 millioner eller 7 % av global årlig omsetning. Det er et bøtenivå som ligger over GDPRs tilsvarende rammetall. For en norsk SMB med 100 millioner i omsetning er den reelle eksponeringen ikke makstaket, men styrets og ledelsens konsekvens ved oppdaget mangel.
De direkte finansielle rammene
€35 millioner-grensen er maksimum, ikke standard. Reelle bøter vil typisk være lavere, men terskelen signaliserer alvor. For norske innkjøpere er det viktigere at AI Act har ekstraterritoriell virkning og at bedrifter må fremme AI-kompetanse blant ansatte som utvikler, bruker eller fører tilsyn med AI-systemer. Brudd på sistnevnte er enkelt å dokumentere ved tilsyn.
Indirekte konsekvenser og omdømme
Stanford HAI dokumenterer 362 AI-hendelser i 2025 og at ansvarlig AI ikke holder tritt med AI-kapasitet, med sikkerhetsbenchmarks som henger etter og hendelser som øker kraftig. Hver hendelse er en mulighet for konkurrenter, ansatte og kunder til å oppdatere sin oppfatning av leverandøren. Indirekte kostnad ved svikt overstiger ofte den direkte boten. En 2023-undersøkelse fant at 52 % av amerikanere var mer bekymret enn begeistret for økt bruk av AI, og 83 % bekymrer seg for at AI ved et uhell kan føre til en katastrofal hendelse. Den publiske toleransen for sikkerhetsfeil er ikke høy.
Vanlige feil i norske AI-innkjøpsprosesser
Fire feil dominerer det vi ser i norske AI-innkjøpsprosesser fra 2025 og inn i 2026. De er ikke kompliserte å rette, men krever at innkjøperen sitter i førersetet og ikke lar leverandørens standardmal styre.
Manglende krav om Frontier Framework
Mange avtaler omtaler «sikkerhet» uten å henvise til at leverandøren har en publisert Frontier AI Safety Framework. 12 selskaper publiserte eller oppdaterte slike rammer i 2025, og dette tallet er enkelt å verifisere. Hvis leverandøren ikke står på listen, må de forklare hvorfor eller dokumentere et alternativ. Alura sin vurdering er at slike rammer er minimumsstandard, ikke beste praksis.
Risikoaksept styrt av leverandøren
Vag formulering som «leverandøren skal opprettholde forsvarlige sikkerhetsnivåer» gir leverandøren definisjonsmakten. EUs Code of Practice fastslår at akseptable risikonivåer må defineres på forhånd. Innkjøperen må kreve det samme i privatretten, ellers blir kontraktens sikkerhetsdel verdiløs i konflikt.
Ingen testdokumentasjon i avtalen
Pre-deployment-test som ikke dokumenteres er ikke gjort. Høyrisiko-AI-systemer krever risikostyringssystem, teknisk dokumentasjon, menneskelig tilsyn og registrering i EU-database. For mer kontekst om hvordan dette spiller inn i leverandørvalg har vi skrevet om kriterier og fallgruver i norske AI-leverandørvalg. Bevisene må leveres, oppbevares, og være tilgjengelige ved tilsyn.
For lite AI-kompetanse på innkjøpersiden
AI Act krever at bedrifter fremmer AI-kompetanse blant ansatte som utvikler, bruker eller fører tilsyn med AI-systemer. Dette er ikke et frivillig HR-initiativ, det er et lovkrav. 80 % av amerikanske high school- og college-studenter bruker AI til skoleoppgaver; den samme læringskurven må gjenspeiles i norske innkjøpsavdelinger. Vår erfaring med AI for kvalitetssikring og testing er at innkjøpere som forstår testpraksis stiller bedre krav.
Spørsmål norske bedrifter stiller om leverandørtesting
Fem spørsmål går igjen når norske ledere skal forhandle med en AI-leverandør i 2026. Svarene under er ment som forhandlingsgrunnlag, ikke som juridisk rådgivning.
Må vi som SMB i Norge forholde oss til EU AI Act?
Ja. AI Act har ekstraterritoriell virkning og dekker ikke-EU-leverandører som opererer i EU-markedet. Norge er gjennom EØS i praksis omfattet, og som kunde av AI-tjenester arver du leverandørens forpliktelser via avtalen din. Hvis leverandøren faller, sitter du igjen med risikoen.
Hva regnes som «høy risiko» under AI Act?
AI Act følger en risikobasert tilnærming og klassifiserer AI-systemer i fire kategorier: uakseptabel risiko, høy risiko, transparens-risiko, og minimal eller ingen risiko. Høyrisiko-AI-systemer krever risikostyringssystem, teknisk dokumentasjon, menneskelig tilsyn og registrering i EU-database. Klassifiseringen avgjør hvor mye dokumentasjon du må kreve.
Hvordan vet vi om en leverandør har en Frontier-ramme?
Du krever den. International AI Safety Report 2026 bekrefter at 12 selskaper publiserte eller oppdaterte Frontier AI Safety Frameworks i 2025. Listen er offentlig, og leverandørens versjon av rammen skal være lenket på deres egne sider. Be om dokumentet, ikke et tilsagn om at det finnes.
Hvor stor andel av AI-forskningen handler egentlig om sikkerhet?
Mindre enn man tror. En CSET-analyse identifiserte 15 000 artikler i åtte AI-sikkerhets-klynger, mot 1,9 millioner i AI-litteraturen totalt, altså mindre enn 1 prosent. Ifølge Center for AI Safety's 2023 Impact Report fokuserer kun 3 % av teknisk forskning på å gjøre AI tryggere. Det øker betydningen av at leverandører bygger inn sikkerhet kontraktuelt, ikke bare arver det fra felles forskning.
Hva er forskjellen på Code of Practice og selve AI Act?
AI Act er loven, Code of Practice er en frivillig operasjonalisering. CSET beskriver Code of Practice som et frivillig verktøy for å hjelpe industrien med å etterleve AI Act. Tilbydere som følger den, antas å oppfylle relevante krav. Tilbydere som ikke følger den, må demonstrere etterlevelse på annen måte, noe som typisk er dyrere og mer tidkrevende.
Sjekkliste for kontraktsforhandling med AI-leverandør
Alura mener at norske innkjøpere bør behandle Frontier AI Safety Frameworks som minimumsstandard, ikke beste praksis. Sjekklisten under er det vi går gjennom i kontraktsforhandlinger fra 2026 og fremover. Den dekker minimum, ikke maksimum, og er bygd for å overleve EU AI Acts håndhevingsfaser. For bredere kontekst har vi skrevet om kriterier og fallgruver i leverandørvalg, og om AI for kvalitetssikring og testing.
Klausuler å forhandle inn
Hver klausul under skal være en testbar forpliktelse, ikke en intensjonserklæring. Hvis leverandøren motsetter seg en klausul, krev en skriftlig begrunnelse. Den begrunnelsen blir bevis hvis det går galt senere.
| # | Klausul | Hjemmel |
|---|---|---|
| 1 | Leverandøren skal ha publisert Frontier AI Safety Framework | International AI Safety Report 2026 |
| 2 | Risikoakseptnivå defineres i avtalen og kan ikke endres ensidig | EU Code of Practice |
| 3 | Pre-deployment-testdokumentasjon leveres ved avtaleinngåelse | Nemko Digital EU AI Act |
| 4 | Modellversjon under terskel utløser kontraktsbrudd | AI safety, Wikipedia |
| 5 | Red-team-resultater leveres minimum årlig | LessWrong om alignment-skjørhet |
| 6 | AI-kompetanse-krav speilet for leverandørens nøkkelpersonell | AI Act om AI-kompetanse |
| 7 | GPAI-status (over 10^25 FLOPs) deklareres og bekreftes ved oppdatering | CSET Code of Practice |
| 8 | Incident-varsling innen 72 timer for sikkerhetshendelser | 2026 AI Safety Report |
Når avtalen er signert
Sjekklisten er ikke statisk. European Parliament godkjente forenklingstiltak 16. juni 2026 som utsatte enkelte forpliktelser for høyrisiko-AI-systemer, og den slags justeringer kommer til å fortsette. Bygg inn en årlig revisjonsklausul som speiler AI Acts håndhevingsfaser. Det er enkleste måten å unngå at avtalen blir foreldet midt i håndhevingsperioden. Stanford HAI bemerker at AI-adopsjon sprer seg med historisk hastighet; reguleringen vil følge etter, og kontrakten må kunne følge med på begge.
I Alura kombinerer vi teknisk AI-kompetanse med praktisk forståelse for GDPR, EU AI Act og Datatilsynets forventninger. Vi hjelper norske virksomheter å bygge AI som tåler en revisjon, uten å bremse innovasjonen.
Bestill en compliance-vurdering: vi kartlegger dine AI-systemer mot gjeldende og kommende krav, og leverer en handlingsplan som faktisk er gjennomførbar. Uforpliktende.
Alura
Praktisk kunnskap om AI-automatisering og effektivisering for norske bedrifter.
Les neste
Amerikansk AI-regulering endrer kalkylen for norske SMB-er
USAs nye AI-kontroll, eksportforbud og CAISI-evalueringer endrer risikobildet for norske SMB-er som lener seg på amerikanske AI-verktøy. Slik bygger du en strategi som tåler stengingen.
AI-pipelines i norske banker: stresstest mot AI Act
Fra 2. august 2026 må norske banker dokumentere at AI-pipelines for kredittscoring tåler tilsyn etter EU AI Act. Her er en konkret stresstest-sjekkliste for risikoteamet.