23 min

    MAI-Thinking-1 i Azure: bør norske SMB-er bytte fra OpenAI?

    Microsoft lanserte sju egne MAI-modeller på Build 2026. Vi går gjennom hva MAI-Thinking-1 og MAI-Code-1-Flash faktisk betyr for norske SMB-er som allerede bruker Azure og Copilot.

    Teknologi & VerktøyMicrosoft MAI-modellerMAI-Thinking-1MAI-Code-1-FlashMicrosoft FoundryAzure AI for SMBMicrosoft Copilot alternativegne AI-modeller Microsoft
    MAI-Thinking-1 i Azure: bør norske SMB-er bytte fra OpenAI?

    Hva Microsoft lanserte på Build 2026: oversikten over MAI-familien

    Microsoft brukte sin Build-konferanse i San Francisco 2. og 3. juni 2026 til å vise frem en helt ny modellfamilie under merkenavnet MAI. Lanseringen ble levert av Mustafa Suleyman på hovedscenen, der han presenterte syv modeller på samme dag. Innholdet sto i kontrast til Microsofts vanlige Azure-narrativ, der OpenAI-modellene har vært den faktiske motoren bak Copilot og ChatGPT-integrasjonene siden partnerskapet startet i 2019.

    For norske CTO-er og produktansvarlige er den retoriske rammen mindre interessant enn den underliggende endringen: Microsoft har nå egne modeller for resonnering, koding, bilde, transkripsjon og tale, alle tilgjengelige gjennom samme Foundry-katalog som OpenAI- og Anthropic-modellene de allerede bruker. Suleyman ledet tidligere DeepMind og Inflection AI, og han har bygget Microsofts interne modellteam siden 2024.

    CNBC peker på at lanseringen reduserer Microsofts avhengighet av OpenAI uten å avslutte partnerskapet, en partner Microsoft fortsatt har 13 milliarder dollar investert i, og 5 milliarder dollar i Anthropic. CEO Satya Nadella beskrev øyeblikket som at "tiden er kommet for at alle selskaper skal delta i frontøkosystemet". Det er en posisjonering mot et bredere, multi-leverandør-bilde der Microsoft selv er en av leverandørene.

    De syv modellene i en oversikt

    Modellene dekker fem ulike domener, og to av dem kommer i både full og Flash-variant for lavere latens. Daymark-analysen beskriver porteføljen som spesialiserte modeller for ulike forretningsbehov, ikke en universalmodell.

    ModellDomeneStatus
    MAI Image-2.5BildegenereringAnnonsert Build 2026
    MAI Image-2.5-FlashRask bildegenereringAnnonsert Build 2026
    MAI Transcribe-1.5TranskripsjonAnnonsert Build 2026
    MAI Thinking-1ResonneringPrivat preview
    MAI Voice-2TaleAnnonsert Build 2026
    MAI Voice-2 FlashRask taleAnnonsert Build 2026
    MAI Code-1-FlashKodingAnnonsert Build 2026

    Lanseringen bygger på et eksisterende fundament. Microsoft annonserte tidligere i 2025 MAI-Transcribe-1 med støtte for 25 språk, og MAI-Voice-1 som kunne produsere et minutt med lyd på under et sekund. Build-lanseringen oppgraderer fire av disse til 1.5- og 2-versjoner og tilfører to nye modeller for koding og resonnering.

    Hvorfor en egen modellfamilie nå?

    Microsoft har selv fremhevet fem motiver bak å bygge egne modeller: kost, latens, spesialisering, compliance og forhandlingskraft. Etter at OpenAI-partnerskapet startet i 2019 har Microsoft i praksis vært prisgitt en ekstern modellleverandør for de tyngste produktene sine. Det å eie modellaget reduserer denne strategiske eksponeringen uten å bryte partnerskapet.

    Koblingen til Microsoft Copilot er sentral. Copilot er Microsofts største enkeltstående AI-produkt, og ifølge Microsofts egen Work Trend Index for 2026 vokste aktive agenter i Microsoft 365-økosystemet 15 ganger år-over-år, og 18 ganger i store bedrifter. Å la en ekstern leverandør stå for inferensen bak alle disse agentene er en kommersiell og strategisk eksponering Microsoft åpenbart vil redusere.

    Arkitekturen bak MAI-Thinking-1 og MAI-Code-1-Flash

    De to modellene CNBC trekker frem som strategisk viktigst er MAI-Thinking-1 og MAI-Code-1-Flash. Den første er en resonneringsmodell ment å konkurrere med Claude Sonnet og GPT-5-klassen. Den andre er en kodemodell rettet mot å levere autocomplete og chat-erfaringer i Copilot-stacken, mer kostnadseffektivt enn dagens løsninger.

    Begge modellene bruker mixture-of-experts (MoE), en arkitektur der bare en delmengde av parametrene aktiveres per token. Det er denne forskjellen mellom totale og aktive parametre som driver Microsofts kostnadshistorie.

    ModellTotale parametereAktive parametereBruksformål
    MAI-Thinking-11 billion35 milliarderResonnering, kompleks problemløsing
    MAI-Code-1-Flash137 milliarder5 milliarderKoding, autocomplete, chat

    Parametertall og MoE-design

    Simon Willison samlet de offisielle tallene: MAI-Thinking-1 har 1 billion totale parametere og 35 milliarder aktive, mens MAI-Code-1-Flash har 137 milliarder totale og 5 milliarder aktive. Forholdet mellom totale og aktive er omtrent 30 til 1 for begge modellene. Det er en svært sparsom aktivering selv etter dagens standard.

    Til sammenligning trente Microsoft sin tidligere modell, MAI-1-preview, på omtrent 15 000 Nvidia H-100 GPUer, mens xAIs Grok ble trent på over 100 000 tilsvarende brikker. Microsoft selger ikke skala som differensiator. Selskapet selger forhold mellom kapasitet og kjøretidskostnad, og MoE-arkitekturen er den tekniske byggesteinen for nettopp dette.

    Treningsdata: Microsofts påstand om "clean and licensed"

    Microsoft markedsfører MAI-Thinking-1 som "trent fra bunnen av på enterprise grade, ren og kommersielt lisensiert data, uten distillering fra tredjepartsmodeller". Det er en posisjonering mot lovsakene som har preget OpenAI og Anthropic.

    Simon Willison fant ved nærmere lesning at treningsdataene inkluderer både en proprietær web crawl og Common Crawl, filtrert for voksent innhold og AI-generert innhold. Tallenes størrelse er betydelig: den proprietære crawlen startet på 1,2 billioner sider, ble redusert til 794 milliarder sider etter filtrering for voksent og piratrelatert innhold. Common Crawl-andelen utgjør 24,2 milliarder sider etter filtrering og deduplisering.

    Påstanden om "ren og lisensiert" må derfor forstås som et lisensregime over crawlen som helhet, ikke som en garanti for at hver enkelt side var direkte lisensiert til Microsoft. Det er den fortolkningen Willison selv lander på, og den er viktig hvis selskapets juridiske team vurderer modellen for et følsomt bruksområde.

    Post-trening: ingen "selvsikker" personlighet

    Microsofts uttalte mål for post-trening er å fjerne egenskaper som får modeller til å virke som om de har følelser og mål. Det er en posisjonering mot OpenAIs mer personlighetspregede chat-erfaring. For et SMB som vurderer MAI-Thinking-1 i kundedialog eller intern beslutningsstøtte kan en mindre "selvsikker" modell være en fordel, all den tid 86 prosent av AI-brukere uansett behandler AI-output som et utgangspunkt, ikke et endelig svar.

    Microsoft Foundry: slik får norske kunder tilgang i privat preview

    Microsoft Foundry-katalogen lister i skrivende stund 11 374 modeller, fra OpenAIs GPT-5.4-Pro til Anthropics Claude Opus 4.7 til åpne modeller som DeepSeek V4 og Kimi K2.6. MAI-modellene plasseres som ett spor blant disse, men med en avgjørende forskjell: de er ikke generelt tilgjengelige.

    CNBC bekrefter at MAI-Thinking-1 i dag er i privat preview gjennom Microsoft Foundry. Det betyr ikke at den er stengt. Det betyr at tilgang gis selektivt, uten formelt SLA, og at API-prising er foreløpig.

    Hvordan Foundry-katalogen fungerer i dag

    For en norsk Azure-kunde er Foundry det samme grensesnittet som tidligere het Azure AI Foundry og før det Azure AI Studio. Plattformen samler modeller, datasett og deploy-flyter på samme rolle- og tilgangsmodell som resten av Azure. En modell i katalogen er ikke automatisk en modell du har provisjonert. Du må be om kvote, deploye en endpoint og velge region.

    Katalogen i seg selv er stor: 11 374 modeller dekker alt fra Gpt-realtime-translate for lav-latens taleoversettelse til Grok 4.2 for resonnering. Det er ikke en mangel på modeller som er problemet for norske SMB-er. Det er valg av rett modell for rett oppgave.

    Hva "privat preview" faktisk betyr

    PCMag refererer Microsofts egen formulering om at modellene er eksperimentelle og i "limited preview". I praksis innebærer det fire ting for SMB-er: ingen oppetidsgaranti, ingen forpliktelse til at API-en forblir bakoverkompatibel, ingen klar prising, og ingen forpliktelse om at modellen i det hele tatt blir generelt tilgjengelig.

    Foundry-modeller i privat preview er greie for å bygge prototyper. De er ikke et grunnlag for kontraktsmessige forpliktelser overfor sluttkunder. Aluras posisjon er at OpenAI- og Anthropic-rutene bør holdes som primære i produksjon til MAI-modellene er ute av privat preview. Det er en risikobasert anbefaling, ikke en kvalitetsdom på modellene selv.

    Kostnadsbildet: hva Microsofts påstand om 10 ganger lavere kostnad mot GPT-5.5 betyr i praksis

    Den enkeltstående kostnadspåstanden Microsoft har vist frem er at en MAI-modell ga 10 ganger bedre kostnadseffektivitet enn OpenAIs GPT-5.5 i en McKinsey-case. Det er en sterk påstand, og den fortjener en kritisk lesning før noen norsk SMB lar den styre Q3-budsjettet.

    Tallet kommer fra Microsofts egen formidling. Det er ikke en uavhengig benchmark fra McKinsey selv, og det spesifiserer ikke arbeidsbelastningen, kontekstlengden eller om sammenligningen inkluderer batch-priser eller kapasitetsreservasjon.

    Hva 10 ganger faktisk kan bety på faktura

    Aktive parametre er hoveddriver for inferenskostnad i MoE-modeller. MAI-Thinking-1 har 35 milliarder aktive parametere mot et antatt høyere tall i GPT-5-klassen. For en arbeidsbelastning som er token-tung, med lang kontekst og mange parallelle brukere, kan en stor forskjell i pris per token utvilsomt komme ut som en lik forskjell i månedskostnad.

    For en arbeidsbelastning som er latenstung og bruker korte prompts, vil andre faktorer dominere. Kald-start, nettverksrundturer og prompt-engineering teller mer enn forskjellen i aktive parametre. Et tall på 10 ganger fra leverandør oversettes sjelden 1 til 1 på din egen faktura, og en SMB bør ikke gjøre langsiktige plassbestillinger basert på det.

    McKinsey-tallet som markedsføring

    At Microsoft trekker frem nettopp McKinsey er strategisk. 88 prosent av McKinseys respondenter rapporterer regelmessig AI-bruk i minst en forretningsfunksjon, men bare 23 prosent skalerer et agentisk AI-system og bare 39 prosent tilskriver noen EBIT-effekt til AI. Microsoft selger til en gruppe som er overbevist om premisset, men som sliter med å hente økonomisk verdi.

    Den underliggende fortellingen Microsoft markedsfører er at billigere inferens hjelper bedrifter å bevege seg fra eksperimentering til reell EBIT-effekt. Det er et legitimt narrativ, men det dekker bare en av flere flaskehalser. BCG finner at 60 prosent av selskaper ikke genererer materiell verdi fra AI. Den primære årsaken er sjelden modellpris.

    Uavhengige tester: PCMag og Simon Willisons funn så langt

    To uavhengige stemmer har testet eller analysert MAI-modellene siden lansering. PCMag-journalisten Ruben Circelli testet fire av modellene og konkluderte med at de er gjennomgående middelmådige sammenlignet med Gemini og Claude. Simon Willison gjennomgikk modellkortene og rettet sin egen feilforståelse av parameterstørrelse offentlig.

    PCMags transkripsjonstest

    I Circellis test gjorde MAI-Transcribe-1.5 13 feil mot Geminis 6 feil på samme lydopptak. Det er en dobbelt så høy feilrate. Microsofts egen markedsføring av forgjengeren hevdet lavere ordfeilrate enn GPT-Transcribe, Gemini 3.1 Flash og andre transkripsjonsmodeller. Spriket mellom egen marketing og uavhengig praktisk test er typisk for preview-modeller, og er et argument for å vente med produksjonsbruk.

    Circelli identifiserte også at MAI-Thinking-1 ikke har internettilgang, og kaller dette en deal-breaker for visse oppgaver. For SMB-er som bruker resonneringsmodeller til å sammenfatte interne dokumenter er dette uvesentlig. For SMB-er som bruker AI til å sjekke aktuelle priser, hendelser eller juridisk status, er det avgjørende.

    Simon Willisons granskning av treningsdataene

    Willison rettet først sin egen feiloversettelse av parametertall, og undersøkte deretter Microsofts påstand om "ren og lisensiert" data. Han fant at treningssettet inkluderer både en proprietær web crawl og Common Crawl. Det er ikke ulovlig, men det utfordrer ideen om at Microsofts modeller er fundamentalt mer "rene" enn konkurrentenes.

    For SMB-er som skal forsvare et modellvalg overfor revisor eller styre, er dette nyansen som teller. Et leverandørspråk om "ren data" er ikke det samme som et juridisk holdbart forsvar mot opphavsrettskrav, og Microsofts egne trilog-anbefalinger til EU AI Act argumenterte for å fjerne kravet om å publisere et sammendrag av opphavsrettsbeskyttet treningsdata, et krav som likevel ble stående.

    MAI-Thinking-1 mot OpenAI og Anthropic i samme stack

    For en kunde som allerede står på Azure er det realistiske valget mellom tre modellfamilier, alle tilgjengelige i Foundry-katalogen: OpenAIs GPT-5-klasse, Anthropics Claude Opus 4.7 og Microsofts MAI-Thinking-1. For en grundigere gjennomgang av forskjellene mellom de store modellfamiliene har vi en bredere artikkel.

    ModellStatus i FoundryFoundry-beskrivelse
    GPT-5.4-Pro (OpenAI)Generelt tilgjengeligOpenAIs mest kapable frontiermodell for komplekst profesjonelt arbeid
    Claude Opus 4.7 (Anthropic)Generelt tilgjengeligAnthropics mest kapable modell, sterk på koding og agentiske oppgaver
    MAI-Thinking-1 (Microsoft)Privat previewMicrosofts resonneringsmodell, eksperimentell

    Posisjonering i Foundry-katalogen

    Foundry-katalogen beskriver Claude Opus 4.7 som Anthropics mest kapable generelt tilgjengelige modell, med forbedret ytelse innen koding, bedriftsarbeidsflyter og langvarige agentiske oppgaver. GPT-5.4-Pro beskrives som OpenAIs mest kapable frontiermodell, bygget for raskere og mer pålitelige resultater for komplekst profesjonelt arbeid. MAI-Thinking-1 har ikke en tilsvarende katalogstatus enda, fordi den ikke er generelt tilgjengelig.

    Hvor MAI-Thinking-1 sannsynligvis kommer best ut

    Simon Willison rapporterer at Microsoft hevder MAI-Thinking-1 er foretrukket fremfor Sonnet 4.6 i blindtester. Dette er Microsofts egen påstand, og blindtestene er ikke åpne for ekstern verifisering. Den mest forsiktige tolkningen: på kostnad per token vil MAI-Thinking-1 trolig være konkurransedyktig, mens på output-kvalitet er bildet ikke avgjort.

    For norske SMB-er som vurderer en kanonisk arbeidsbelastning som dokumentsammenfatning eller intern Q&A, vil forskjellen mellom topp-modeller ofte være mindre enn forskjellen i hvordan prompts struktureres. Det betyr at et modellbytte sjelden er det høyeste ROI-tiltaket dere kan gjøre denne måneden.

    Hva endrer seg ikke: EU AI Act og Copilot-bruk i Norge

    Den viktigste regulatoriske rammen for norske bedrifter er EUs AI Act. Loven er, ifølge Rencore, "verdens første omfattende, bindende juridiske rammeverk for kunstig intelligens", og den klassifiserer AI-systemer i fire risikokategorier: uakseptabel risiko, høy risiko, begrenset risiko og minimal risiko.

    Tidslinjen er ikke en enkelt deadline. Den er en serie tidspunkter som påvirker forskjellige typer systemer på forskjellige måter.

    DatoHendelse
    1. august 2024EU AI Act trer i kraft
    2. februar 2025Forbud mot uakseptabel AI-praksis
    10. juli 2025Endelig GPAI-atferdskodeks publisert
    2. august 2025Forpliktelser for generelle AI-modeller begynner å gjelde
    2. august 2026Hoveddato for høyrisiko-AI og de fleste bestemmelser
    2. august 2027Overgangsperiode slutter for eldre GPAI-modeller

    Risikoklassen følger bruksformålet, ikke modellvalget

    Det er en utbredt misforståelse at risikoklasse settes av hvilken modell du bruker. Aluras posisjon er motsatt: EU AI Act-risikoklassen følger bruksformålet, ikke modellvalget. Hvis dere bruker en MAI-modell i stedet for en OpenAI-modell i samme HR-screening-flyt, er systemet fortsatt høyrisiko. Bytte i Foundry endrer ikke om systemet er høyrisiko.

    Rencore poengterer eksplisitt at Copilot er "typisk et AI-system med begrenset risiko, men kan bli høyrisiko hvis det brukes i ansettelsesbeslutninger". Det er det samme prinsippet for MAI-modellene. Risikovurderingen følger arbeidsbelastningen, ikke produsentens logo. For en bredere gjennomgang av hvordan Copilot brukes i Microsoft 365 har vi en egen guide.

    Microsofts Trust Center bekrefter at loven har en risikobasert tilnærming og fases inn over flere år, med første bestemmelser i februar 2025. For norske SMB-er er det avgjørende at risikovurdering er et levende dokument, ikke en engangsøvelse.

    Hvor langt har Microsoft kommet i sitt eget compliance-arbeid

    Microsoft har bygget en lagdelt tilnærming over flere år. Selskapet har publisert 33 Transparency Notes siden 2019, ifølge Microsoft On the Issues, og var blant de første organisasjonene som signerte AI Pact. Selskapet har også oppdatert kontrakter for å forhindre feil bruk av AI-systemer og innlemmet "forbudt praksis" i sin interne Restricted Use Policy.

    Det finnes over 60 sekundære regulatoriske tiltak under AI Act som vil påvirke implementeringsforventninger, ifølge Microsofts egen oversikt. Det er ikke et stabilt mål for norske SMB-er å sikte mot. Det er en regulatorisk overflate i bevegelse, og en MAI-eller-OpenAI-beslutning løser ikke nødvendigvis compliance-spørsmålene en gang for alle.

    Hva Microsoft har lobbyet for, og hva som ble vedtatt

    Microsoft har historisk lobbyet for en mer målrettet definisjon av fundamentmodeller. I sine trilog-anbefalinger fra 11. september 2023 argumenterte selskapet for å fjerne krav om å publisere sammendrag av opphavsrettsbeskyttet treningsdata, og for å erstatte "reasonably foreseeable risks" med "identified risks". Mye av dette ble ikke etterkommet.

    For SMB-er som vurderer MAI-modellene er det relevant: Microsofts egne juridiske team har ikke fått ønsket fleksibilitet på treningsdata-transparens, og det legger press på selskapets påstander om "rent" data. Samme dokument argumenterer for at fundamentmodell-leverandører bare bør oppbevare teknisk dokumentasjon i 10 år, noe som viser at Microsoft selv ser den regulatoriske byrden som høy.

    Beslutningsramme for norske SMB-er: produksjon, pilot eller vent

    Et brukbart beslutningsverktøy må reflektere både modellens modenhet og deres egen risikotoleranse. For norske SMB-er bryter valget i praksis ned i tre scenarier.

    ScenarioNår det passerHva dere bør gjøre denne uken
    VentEksisterende OpenAI- eller Anthropic-rute, kundekontrakter med oppetidskravFølg med på GA-kunngjøringer, ikke flytt trafikk
    PilotInterne arbeidsbelastninger uten kundekontakt, kostnad er hovedflaskehalsBygg evalueringssett, søk preview-tilgang, parallellkjør
    Full innfasingTunge inferensbelastninger, egen evaluering bekrefter kvalitetKrever robust rollback og parallell trafikk i minst to uker

    Når "vent" er det riktige svaret

    Hvis dere har en eksisterende OpenAI- eller Anthropic-rute som leverer i dag, og dere er bundet av kundekontrakter med oppetidsforpliktelser, er svaret enkelt. Aluras posisjon er at OpenAI- og Anthropic-rutene bør holdes som primære i produksjon til MAI-modellene er ute av privat preview. Skifte uten en åpenbar gevinst introduserer risiko uten oppside.

    For en grunnleggende oversikt over modellvalg tilbyr vi en bredere gjennomgang. Hovedpoenget er at preview-modeller ikke er et legitimt grunnlag for SLA-er overfor kunde. Hvis dere ikke kan si til kunden at "systemet er bygget på generelt tilgjengelig infrastruktur", har dere et kontraktuelt problem som koster mer enn enhver kostnadsbesparelse fra modellbyttet.

    Når pilot gir mening

    For interne arbeidsbelastninger uten kundekontaktflate, der dere kan tolerere noen ukers tilbakeskritt hvis en modell trekkes, er pilot et legitimt valg. Aluras posisjon er at MAI-Code-1-Flash bør testes i et sandkassemiljø før dere vurderer å redusere Copilot-bruken for kjerneutvikling.

    GitHub Copilot er den faktiske produktivitetsflaten mange utviklerteam står på. Tallene er entydige: Microsofts diffusjonsrapport viser at git pushes vokste 78 prosent år-over-år globalt, at antall nye git-repositorier økte 45 prosent, og at AI-assosierte pull requests på GitHub vokste 28 ganger siden juni 2025. En forhastet flytting kan dempe denne effekten og gi en regresjon ingen kunde har bedt om.

    Når full innfasing kan forsvares

    Det smale scenarioet der full innfasing forsvarer seg selv: en intern arbeidsbelastning der inferenskostnaden er en signifikant del av løpende kostnad, og der dere har et eget evalueringssett som viser at MAI-Thinking-1 holder kvaliteten. Det krever et evalueringsregime som ikke bygger på Microsofts egne marketing-tall.

    Selv da bør innfasingen være gradvis, og rollback-stien må være testet før produksjonsmigrering starter. PCMags egen vurdering minner om at modellene fortsatt er i limited preview, og det er ikke en status som garanterer at API-en forblir slik den var i forrige uke.

    Praktisk: slik kobler du en MAI-modell inn i Azure mandag morgen

    For team som vil komme i gang, er det en konkret rekkefølge som reduserer fallhøyden. Steget før koden er viktigere enn koden.

    Tilgangsforespørsel og venteliste

    MAI-Thinking-1 er i privat preview gjennom Microsoft Foundry. Tilgang gis ikke automatisk for alle Azure-abonnenter. Send forespørsel via Foundry-katalogen, oppgi forventet bruksvolum og arbeidsbelastning. Forvent ventetid.

    I mellomtiden kan dere validere arbeidsbelastningen mot Claude Opus 4.7 eller GPT-5.4-Pro i samme katalog, slik at testarbeidet ikke står stille. Foundry-katalogen lister 11 374 modeller, og mange av dem dekker tilsvarende bruksområder som MAI-modellene gjør. For en bredere oversikt over Azure AI og andre sky-tjenester for norske bedrifter har vi en egen gjennomgang. Ventelisten er ingen unnskyldning for å stoppe.

    Sandkasse, evalueringssett og rollback

    Bygg et evalueringssett før dere ber om tilgang, ikke etter. Et minimum er 50 til 100 representative oppgaver med fasit, der "fasit" kan være menneskelig dom på 1 til 5 skala. Kjør samme sett mot eksisterende modell og MAI-modellen, og logg latens, kostnad per token og kvalitetsdom side om side. Sørg for at rollback til opprinnelig modell er en konfigurasjonsendring, ikke en omdeploy.

    I evalueringen, ikke glem at 86 prosent av AI-brukere behandler AI-output som et utgangspunkt, ikke et endelig svar. En modell som scorer marginalt lavere på automatisert benchmark, men som genererer bedre utkast for menneskelig redigering, kan være det rette valget likevel. C5 Insight oppsummerer at menneskelig dømmekraft blir viktigere ettersom AI tar over mer utførelse.

    Logging, observability og kostnadssporing

    Hver MAI-kall bør logges med token-tall inn, token-tall ut, latens og hvilken modell-versjon som svarte. For preview-modeller er versjonen avgjørende. Microsoft kan endre vektene eller deploye en oppdatert variant uten varsel, og en regresjon vil være umulig å diagnostisere uten versjonsstempel i loggene.

    Knytt logging til en kostnadsrapport som viser modellkost per arbeidsbelastning. 66 prosent av AI-brukere rapporterer at AI gir mer tid til høyverdig arbeid, men kostnadssiden av samme regnestykke må dokumenteres uavhengig. En besparelse på 10 ganger på inferensraten betyr lite hvis bruksvolumet samtidig vokser 20 ganger.

    Vanlige feil når preview-modeller settes i drift

    Forretningsteamet ser et lovende kostnadstall og vil flytte raskt. Fire typer feil dukker opp igjen og igjen i piloter med preview-modeller.

    Å erstatte uten å parallellisere

    Den mest skadelige feilen er å flytte produksjonstrafikken til en preview-modell uten en periode med parallell drift. Når kvalitetsproblemer dukker opp, har dere ingen referansebaseline. Kjør shadow traffic mot den nye modellen i minst to uker, sammenlign output i etterkant, og flytt først når dere har data dere selv tror på.

    Å lese egne benchmark som uavhengig sannhet

    Microsofts påstand om 10 ganger lavere kostnad mot GPT-5.5 er en leverandørpåstand, ikke en kollektivt verifisert sannhet. Det samme gjelder Microsofts påstand om at MAI-Thinking-1 er foretrukket fremfor Sonnet 4.6 i blindtester. Lag deres egne tall på deres egen arbeidsbelastning før dere argumenterer for endring overfor styret. Marketingtall er sjelden representative for SMB-arbeidsbelastninger.

    Å glemme at "preview" betyr SLA-fri

    PCMag dokumenterer Microsofts egen merkelapp på modellene som "limited preview". Hvis dere lover SLA til kunder basert på en modell som ikke selv har SLA, eksponerer dere bedriften for kontraktuell risiko. Dette er den klareste enkeltkilden til kostnad i et mislykket pilotløp, og det er en risiko som vokser jo lenger preview-perioden varer.

    Å undervurdere data-residency

    Norske kunder må forholde seg til både GDPR og EU AI Act. Foundry-modeller kan deployes i ulike regioner, men en preview-modell trenger ikke å være tilgjengelig i alle EU-regioner. Sjekk hvor modellen kjører, hvor data lagres i logger, og hva Microsofts dataretensjon for preview-modeller faktisk sier i avtalen dere signerer.

    Microsoft har oppdatert kontrakter for å forhindre feil bruk av AI-systemer, men kontraktene for preview-modeller er ofte tynnere enn for generelt tilgjengelige tjenester. Det er nettopp her dere må lese det som står med liten skrift, og helst forhandle inn en utgangsklausul hvis Microsoft endrer modellen vesentlig.

    Markedsobservasjoner: hva Microsofts skifte sier om resten av økosystemet

    Microsofts skifte mot egne modeller skjer ikke i et vakuum. Det skjer mens AI-bruk fortsatt vokser raskere enn organisasjoners evne til å hente verdi av den.

    Diffusjonsbildet for AI globalt

    Microsofts egen diffusjonsrapport for Q1 2026 dokumenterer at andelen av verdens yrkesaktive befolkning som bruker AI fortsetter å vokse. UAE leder global diffusjon foran USA, som rykket opp fra 24. til 21. plass i bruksandel. Gapet mellom Global North på 27,5 prosent og Global South på 15,4 prosent øker. Norge inngår i Global North-segmentet.

    Den samme rapporten viser at git pushes vokste 78 prosent år-over-år globalt, og at antall nye git-repositorier vokste 45 prosent sammenlignet med Q1 2025. Japan opplevde en spesielt sterk økning, med 3,4 prosentpoeng vekst i AI-bruk og 129 prosent vekst i git pushes år-over-år. Det er den underliggende grunnen til at Microsoft prioriterer en egen kodemodell. Kodevolumet er der inferenskostnadene faktisk hoper seg opp.

    Frontier-zonen og hvorfor det betyr noe for SMB-er

    Work Trend Index 2026 plasserer 19 prosent av AI-brukere i "Frontier"-segmentet, der 80 prosent sier de produserer arbeid de ikke kunne for et år siden, mot 58 prosent i hele AI-brukerbasen. Den interessante observasjonen: organisatoriske faktorer står for 67 prosent av rapportert AI-effekt mot 32 prosent for individuelle faktorer.

    Valget mellom MAI og OpenAI betyr lite hvis ledelsen ikke er samstemt. Bare 26 prosent av AI-brukere sier ledelsen er tydelig og konsekvent samstemt om AI, og 65 prosent frykter å falle bak hvis de ikke tilpasser seg raskt. C5 Insight kaller dette spenningen mellom ansattes beredskap og organisasjoners manglende støtte for "Transformation Paradox".

    Hva andre rammeverk sier om verdien

    Forbes' Moor Insights oppsummerer flere store undersøkelser: McKinsey rapporterer 88 prosent regelmessig bruk i minst en forretningsfunksjon, men bare 39 prosent tilskriver EBIT-effekt til AI, og bare 23 prosent skalerer et agentisk AI-system. BCG finner at 60 prosent av selskaper ikke genererer materiell verdi fra AI, og at 85 prosent av ansatte fortsatt er i "task-assistance" og "task-delegation"-stadiene.

    WEF anslår 170 millioner nye jobber innen 2030 mot 92 millioner forskyvninger, netto 78 millioner. 40 prosent av arbeidsgivere forventer arbeidsstyrke-reduksjon der AI kan automatisere oppgaver. For en SMB betyr disse tallene at modellvalg er en mindre del av verdihistorien enn arbeidsflyten rundt modellen. Den teknologiske beslutningen er sjelden flaskehalsen for ROI.

    FAQ: lisens, datalagring og OpenAI-partnerskapet

    Spørsmålene vi hører oftest fra SMB-ledere etter MAI-lanseringen samler seg om fire temaer: lisens, datalagring, partnerskap og tidshorisont.

    Er MAI-Thinking-1 åpen kildekode?

    Nei. Microsoft beskriver MAI-Thinking-1 som lukket modell, trent fra bunnen av uten distillering fra tredjepartsmodeller. Tilgang skjer gjennom Microsoft Foundry, ikke gjennom modellvekter.

    Hvis dere har et krav om at modellen må kunne kjøres on-prem, er MAI ikke alternativet. Se da på Phi-3-familien som Microsoft lanserte i 2024, eller på åpne modeller som DeepSeek V4 i Foundry-katalogen.

    Endrer MAI-satsingen OpenAI-partnerskapet?

    Nei, ikke kontraktuelt. Microsoft fortsetter med en 13 milliarder dollar investering i OpenAI og en 5 milliarder dollar investering i Anthropic. OpenAI-partnerskapet startet i 2019 og er ikke avsluttet.

    Den strategiske endringen er at Microsoft ikke lenger er enleverandør-avhengig. Daymark-analysen beskriver dette som at Microsoft "ikke ønsker å være avhengig av én enkelt modellleverandør for sin AI-fremtid", samtidig som GitHub Copilot fortsetter å bli mer agentisk og dyrere.

    Kan vi bruke MAI-modellene utenfor EU-regioner?

    Teknisk ja, kommersielt avhengig av deres egen compliance-vurdering. EU AI Act gjelder bedrifter utenfor EU som plasserer AI-produkter på EU-markedet eller produserer AI-systemer hvis output brukes i EU.

    En norsk SMB er underlagt loven uavhengig av om modellen kjører i Sverige eller USA. Vurder dataresidens ut fra GDPR og kundekrav, ikke ut fra hvilken modellfamilie dere bruker. Microsofts Trust Center har en god innledende oversikt, men erstatter ikke en egen juridisk vurdering. Sammenligning mot andre AI-plattformer og sky-tjenester for norske bedrifter kan også informere beslutningen.

    Hva med data brukt under preview?

    Microsofts Trust Center om EU AI Act bekrefter at selskapet har oppdatert kontrakter for å forhindre feil bruk av AI-systemer. For preview-modeller bør dere likevel sjekke avtalen spesifikt: tillater dere at prompts og outputs brukes til videre modellforbedring? For konfidensielle arbeidsbelastninger er svaret ofte at det ikke gjør dere.

    Microsoft har et eget program for transparens som har publisert 33 Transparency Notes siden 2019, ifølge Microsofts egen oversikt. Sjekk om MAI-Thinking-1 har en publisert Transparency Note før dere går videre med en konfidensiell arbeidsbelastning.

    Når blir modellene generelt tilgjengelig?

    Microsoft har ikke kunngjort en dato. Suleymans Build 2026-presentasjon nevnte ikke en GA-plan, og CNBC har ikke fått en kommentar fra Microsoft om tidslinjen.

    Planlegg som om dette kan ta seks til tolv måneder, og som om Flash-variantene typisk vil komme før de tyngste resonneringsmodellene. Det er mønsteret Microsoft har fulgt for andre familier.

    Oppsummering og anbefaling for norske SMB-er

    For norske SMB-er som vurderer MAI-Thinking-1 og MAI-Code-1-Flash i sin Azure- og Copilot-stack, bryter analysen ned i tre konkrete vurderinger.

    Det viktigste på en side

    Microsoft har levert syv MAI-modeller på Build 2026, hvorav de to viktigste for SMB-segmentet er MAI-Thinking-1 (1 billion totale parametere, 35 milliarder aktive) for resonnering og MAI-Code-1-Flash (137 milliarder totale, 5 milliarder aktive) for koding. Begge er i privat preview gjennom Foundry-katalogen.

    Microsoft hevder 10 ganger kostnadsfordel mot OpenAIs GPT-5.5 i en McKinsey-case, men dette er ikke uavhengig verifisert. PCMags tester peker på praktiske mangler som manglende internettilgang og 13 transkripsjonsfeil mot Geminis 6 på samme lydopptak. EU AI Act-rammen endrer seg ikke med modellvalget. Hoveddato for høyrisiko-AI er 2. august 2026.

    Aluras tre anbefalinger

    Først: Hold OpenAI- og Anthropic-rutene som primære i produksjon til MAI-modellene er ute av privat preview. Risiko uten oppside er ikke et godt bytte for et SMB med kundekontrakter.

    Dernest: Test MAI-Code-1-Flash i et sandkassemiljø før dere vurderer å redusere Copilot-bruken for kjerneutvikling. Det gir dere data på faktisk kvalitet og kost uten å sette utviklerproduktiviteten på spill. Copilot er den faktiske produktivitetsflaten som leverer i dag.

    Til sist: Husk at EU AI Act-risikoklassen følger bruksformålet, ikke modellvalget. Bytte i Foundry endrer ikke om systemet er høyrisiko. For et bredere blikk på modelltyper har vi en gjennomgang av GPT, Claude, Gemini og andre store modeller, samt en oversikt over AI-plattformer og sky-tjenester for norske bedrifter.

    I Alura bygger vi AI-infrastruktur for norske virksomheter, fra dataplattformer til agentiske systemer i produksjon. Vi er ikke en SaaS-leverandør. Vi er håndverkere som setter sammen byggesteinene som faktisk fungerer for din situasjon.

    Bestill en arkitektur-samtale: vi går gjennom din nåværende infrastruktur, identifiserer integrasjonspunkter, og foreslår en pragmatisk vei videre. Uforpliktende, 45 minutter.

    A

    Alura

    Praktisk kunnskap om AI-automatisering og effektivisering for norske bedrifter.