Vegvísir: Claude og GPT og gagnabrýr

Hér er þriðja greinin af sex. Í hluta 1 fjallaði ég um hvað vinnslusamningur er og hvers vegna íslenskt atvinnulíf þarf að fylgjast grannt með breytingum á þeim.

Loforðið sem heldur ekki, hluti 3.

Andri Örvar Baldvinsson

Greinar

Hér dreg ég saman heildarmyndina: hvernig sömu módelin geta lent á gjörólíkum stað eftir þeirri leið sem þú velur með gagnvirkum vegvísi.

Eins og við höfum séð á síðustu mánuðum eru samningarnir milli skýjarisanna og módelaframleiðenda farnir að birtast hver á eftir öðrum sem stundum geta haft áhrif á hvar gögnin þín lenda. Það sem ruglar suma í ríminu er að Anthropic og OpenAI eru bæði til staðar inni í umhverfi skýjarisanna og bjóða einnig upp á sína eigin API-þjónustu beint eða áskriftir með sínum eigin client.

Leiðirnar sem standa til boða eru þrettán talsins eins og staðan er núna, og listinn er ekki tæmandi - samningar bætast við og staðan breytist hratt. Í stað þess að telja þær allar upp hér tek ég þrjú dæmi sem sýna litrófið, og neðar í greininni er gagnvirkur vegvísir þar sem þú getur fundið nákvæmlega þína leið. Kjarninn er þessi: sömu módelin lúta gjörólíkum vinnslusamningum eftir því hvernig þú hnýtir þau við þinn rekstur.

Þrjú dæmi um sömu módelin

Amazon Bedrock (Claude í AWS)  innan EU Data Boundary. Þegar þú kallar í Claude í gegnum Amazon Bedrock keyrir módelið innan AWS á því svæði sem þú velur (t.d. Frankfurt eða Stokkhólmi). Gögnin lúta vinnslusamningi við AWS (AWS DPA undir evrópskri lögsögu). Anthropic sér ekki gögnin þín í þessari uppsetningu og þau yfirgefa aldrei AWS-umhverfið.

Microsoft 365 Copilot  bæði innan og utan. Hér eru bæði OpenAI og Anthropic undirvinnsluaðilar Microsoft fyrir mismunandi hluta upplifunarinnar. Copilot er innan gagnasvæðis ESB fyrir OpenAI-módel (á EU/EFTA-tenants), en fer utan þeirra (til Bandaríkjanna) í þeim tilvikum sem Claude vinnur verkefnið. Kerfið velur módelið eftir verkefnum, þannig að sama varan getur verið bæði innan og utan gagnasvæðis eftir atvikum. Samningurinn heyrir undir Microsoft DPA.

ChatGPT Plus / Free utan, og deilir til þjálfunar. Einstaklingsáskriftin (chatgpt.com og smáforrit). Engin evrópsk hýsing í boði og gögnin eru í Bandaríkjunum. Það sem meira er, þá eru gögnin sjálfgefið notuð til þjálfunar nema slökkt sé á því handvirkt. Þetta er sá pakki sem flestir starfsmenn nota persónulega, sem þýðir að vinnugögn geta borist inn í þjálfunarferli OpenAI án þess að fyrirtækið viti af því.

Finndu þína leið

Í stað þess að lesa þig í gegnum allar þrettán leiðirnar geturðu svarað þremur einföldum spurningum hér að neðan - hvaða model þú notar, hvernig þú nálgast það, með hvaða leið og séð strax hvort hún heldur gögnunum innan EU Data Boundary, hver vinnsluaðilinn er og undir hvaða lögsögu hún heyrir:

Hvar lenda gögnin þín?

Svaraðu þremur spurningum og sjáðu hvort þín leið heldur gögnunum innan EU Data Boundary.

1Hvaða módel ert þú að nota eða langar að nota í vinnunni?

Vilt þú frekar sjá allar þrettán leiðirnar hlið við hlið er heildartaflan með í hlutum 1 og 2, þar sem hægt er að sía hana eftir módeli, vinnsluaðila, EU Data Boundary og lögsögu.

Eru undantekningar á því að vinnsla haldist innan Evrópu?

Stutta svarið er já. Allir skýjarisarnir bjóða upp á útfærslur þar sem gögn geta farið á flakk, og munurinn liggur í því hver sjálfgefna stillingin er og hversu meðvitaður þú ert um valið.

AWS Bedrock býður upp á eiginleikann Cross-Region Inference sem valkvæða stillingu (e. opt-in). Ef þú velur ákveðinn svæðisbundinn endapunkt (t.d. Frankfurt) fer vinnslan hvergi annað. Þú getur líka valið landfræðilegan endapunkt („EU") sem dreifir álagi á milli evrópskra svæða (Frankfurt, Stokkhólms, Írlands, Parísar) en heldur gögnunum innan Evrópu. Að lokum er hægt að velja alþjóðlegan endapunkt (e. Global endpoint) sem getur sent beiðnir hvert sem er á heimsvísu, en það velur þú sjálfur.

Vertex AI hjá Google notar sambærilegt fyrirkomulag með svæðisbundnum (e. regional), fjölsvæða (e. multi-region) og alþjóðlegum (e. global) endapunktum. Fjölsvæða endapunktur dreifir álagi innan ESB eða Bandaríkjanna, svæðisbundinn heldur sig á einum stað, en alþjóðlegur getur farið hvert sem er og aftur velurðu þetta sjálfur.

Microsoft 365 Copilot notar hins vegar eiginleika sem kallast Flex Routing, sem hefur verið sjálfgefið kveikt á nýjum tenants frá mars 2026. Hægt er að slökkva á honum, en sjálfgefna stillingin leyfir flutning á OpenAI-vinnslu út fyrir ESB þegar álag er mikið (Claude-vinnsla er eins og áður sagði hvort sem er utan evrópskra gagnasvæðisins).

Þetta er munurinn í einni setningu: Hjá Bedrock og Vertex þarftu að velja að fara út fyrir svæðið þitt, en hjá Microsoft þarftu að velja að gera það ekki.

Góð spurning til að leggja fyrir þjónustuaðilann þinn:

Hvers konar endapunkta (e. endpoint) erum við að nota í dag í skýjinu, og hvað gerist nákvæmlega þegar álagið eykst hjá skýjarisanum – fara gögnin mín nokkuð á flakk?

💡 Ertu að týnast í hugtökunum?

Ef þig langar að skilja betur öll þessi nýju nöfn, skammstafanir og tæknihugtök í gervigreindinni (eins og MCP, RAG og fleira), mæli ég eindregið með að kíkja á greinina: Má bjóða þér brenglaðan gagnagraut?

Gagnabrýr sem gleymast 

Þetta er í raun svo stórt mengi að það kallar á heila grein út af fyrir sig en mig langar að skjóta þessu inn sem smá „food for thought“ fyrir þá sem þekkja til. Það dugar skammt að módelið sjálft sé öruggt innan Evrópu ef „gagnabrúin“ sem matar það lekur.

Sífellt fleiri fyrirtæki eru farin að tengja gervigreindina beint við innri kerfi (viðskiptakerfi, skjalasöfn eða sértækan hugbúnað) í gegnum API eða MCP-þjónustur (Model Context Protocol).

Tæknilega hættan: Ef þessi tenging eða gagnabrúin sjálf keyrir á bandarískum netþjóni, fer fyrirspurnin þangað til að sækja gögnin áður en evrópska gervigreindin fær að svara. Um leið er verndin sem þú hélst að þú hefðir rofin og það ekki af gervigreindinni sjálfri, heldur vegna tæknihögunar sem mögulega var ekki búið að rýna nægjanlega vel.

Breytingar á vinnslusamningum annara kerfa: Hin hliðin á peningnum snýr að kerfunum sem þú ert að tengja gervigreindina við. Hugsum um risa eins og Atlassian (Jira og Confluence) sem mörg íslensk fyrirtæki nota á innviðum innan Evrópu. Í ágúst 2026 taka gildi nýir skilmálar (Data Contribution Policy) þar sem Atlassian byrjar sjálfgefið að nota gögn viðskiptavina til að þjálfa gervigreindarmódel sín.

Það sem breytir leiknum þarna er að ef fyrirtækið þitt er á Free, Standard eða Premium áskriftum, er söfnun á lýsigögnum t.d. leitarorðum starfsmanna, uppbyggingu verkefna og upplýsingum í Confluence notuð í þjálfun. Oft eru þetta gríðarlega dýrmæt gögn og það er auðvelt að sjá hvernig þessi innsýn gefur Atlassian einstakan glugga inn í verklag og ferla sem enginn annar á að hafa aðgang að og aðeins þeir sem borga fyrir dýrustu Enterprise leyfin hafa eitthvað um þetta að segja.

Þetta lögmál á við um öll gögn: Það skiptir ekki bara máli hvar módelið situr, heldur hvert fyrirspurnirnar fara, hvernig þær ferðast (MCP/API) og hvaða skilmálar gilda um kerfin sem þær snerta.

Hvað er framundan?

Í hlutum 1 til 3 höfum við farið yfir hvernig skýjarisarnir starfa í dag, hvar evrópsk gagnasvæði (EU Data Boundary) halda og hvar ekki, og hvers vegna sömu módelin (Claude og GPT) geta hegðað sér á ólíkan hátt eftir því hvaða leið þú velur því núna nægir ekki einu sinni að velja réttan skýjarisa eða réttan módelframleiðanda, þú þarft líka að velja réttu leiðina innan hans.

Í hluta 4 mun ég kafa ofan í afleiðingarnar: hvers vegna þetta er ekki bara tæknilegt úrlausnarefni heldur viðskiptaleg ákvörðun sem kaupandinn þarf að bera ábyrgð á. Við skoðum hvernig eitt lítið hak í stillingum getur flutt gögnin þín frá Frankfurt til Virginíu áreynslulaust, og hver ábyrgð þjónustuaðilans er í þessu ferli.

Í hluta 4 mun ég kafa ofan í afleiðingarnar: hvers vegna þetta er ekki bara tæknilegt úrlausnarefni heldur viðskiptaleg ákvörðun sem kaupandinn þarf að bera ábyrgð á. Við skoðum hvernig eitt lítið hak í stillingum getur flutt gögnin þín frá Frankfurt til Virginíu áreynslulaust, og hver ábyrgð þjónustuaðilans er í þessu ferli.

Í hluta 5 tek ég fyrir gögn sem leka gegnum kóða í hugbúnaðarþróun, og í lokahluta 6 förum við yfir valið á milli ólíkra módela og hvaða lykilatriði þarf að hafa í huga þegar ákvörðun um innleiðingu er tekin.


Hafðu samband