Ákvörðunin: hvað þarf til?

Í hlutum 1 til 3 tók ég saman hvar Claude og GPT eru keyrð og hvernig sömu módel geta fallið undir margs konar ólíkar uppsetningar á gervigreindinni.

Loforðið sem heldur ekki, hluti 6

Andri Örvar Baldvinsson

Greinar

Í hluta 4 fór ég yfir ábyrgð kaupenda og í hluta 5 tók ég fyrir gögn sem leka í gegnum kóða við hugbúnaðarþróun. Hér er taflan til upprifjunar og þú getur prófað þig áfram með síurnar:

Hvar lenda gögnin þín?

Svaraðu þremur spurningum og sjáðu hvort þín leið heldur gögnunum innan EU Data Boundary.

1Hvaða módel ert þú að nota eða langar að nota í vinnunni?

Fimm greinar hafa nú farið í að sýna fram á hversu margslungið þetta landslag er orðið: þrettán leiðir að tveimur módelum, hver með sína gagnavernd, sína lögsögu og sína endapunkta. Eðlilega situr lesandinn eftir með eina spurningu: gott og vel, en hvernig vel ég þá? Þessi lokahluti snýst einmitt um það. Hann snýst ekki um hvaða módel sé best, þótt það skipti máli, heldur hvernig hægt er að taka góðar og upplýstar ákvarðanir.

Togstreita af freistingum

Þegar landslagið er orðið svona flókið finnur maður að suma langar að finna eitt kerfi sem dekkar allar þeirra þarfir og hætta að hugsa um hin.

Vandinn er sá að þessi nálgun gengur sjaldnast upp í praktík. Þegar hún bregst gerist nákvæmlega það sem við viljum forðast: aðrar lausnir eru teknar inn sem hálfgerð eftir á hugsun til að brúa ákveðið bil, til dæmis þegar nýr og öflugur eiginleiki er kynntur til sögunnar sem á að heita besti valkosturinn í bransanum.

Við þetta myndast fljótt ákveðin dómínó-áhrif þegar horft er til annarra í sama geira. Öflugustu hugbúnaðarhúsin byrja að horfa til Claude, hugbúnaðardeildir í einkageiranum fylgja í kjölfarið til að missa ekki af lestinni og allt í einu eru ríkið, sveitarfélög eða stórar fjármálastofnanir byrjuð að gera það sama.

Með þessu skapast gjarnan fölsk öryggiskennd í kringum gervigreindar innleiðingar. Ákvörðunin er tekin í flýti án allrar þeirrar ígrundunar og áhættumats sem átti að einkenna ákvörðunina og þá er gripið í eitt atriði og það látið bera alla ákvörðunina uppi. Stundum er það verðið: við notum bara það ódýrasta. Stundum staðsetningin: við notum bara það sem er innan EU. Stundum gæðin: við notum bara það besta, sama hvað það kostar. Hvert atriði lítur skynsamlega út eitt og sér en góð ákvörðun stendur á meiru.

Því á bak við þessi atriði liggja í raun mörg öfl sem togast á: gæði módelsins, kostnaðurinn við að keyra það, hvar vinnslan fer fram og öryggið í kringum hana. Þau benda sjaldan öll í sömu átt. Besta leiðin til að sjá það er ekki að telja þau upp heldur að horfa á hvernig togstreitan birtist í raun og hér nefni ég nokkur sem flestir kannast við.

Áður en ég nefni nokkur dæmi sem flestir kannast við getur þú mátað öflin fjögur við þínar eigin áherslur hér að neðan, vogin segir þér ekki hvað er rétt, hún sýnir þér hvaða togstreita er til staðar á milli þeirra.

Hluti 6 · Ákvörðunarvogin

Hvað vegur þyngst hjá þér?

Fjögur öfl togast á í hverri ákvörðun um gervigreind, og þau benda sjaldan öll í sömu átt. Raðaðu þeim eftir áherslum hjá þér. Hún sýnir þér togstreituna sem myndast við ákveðnar áherslur.

Dragðu til, eða notaðu örvarnar — 1 vegur þyngst:
  • Gæði
    Fullkomið módel eins og t.d. Claude eða önnur utan Evrópu
  • Kostnaður
    Ódýrast að nota
  • Staðsetning
    Vinnslan innan EU Data Boundary
  • Öryggi
    Innan ramma sem þú þekkir og treystir
Áherslurnar í valinu þínu — því meira sem efsta og neðsta vídd toga hvor á móti annarri, því skarpari verður togstreitan:
GæðiStaðsetning
Besta módelið togar út fyrir EU, EU-vinnslan togar inn fyrir. Hér vegur Gæði þyngra.
KostnaðurÖryggi
Ódýrasta leiðin og þinn eigin öryggisrammi fara ekki alltaf saman. Hér vegur Kostnaður þyngra.
Gæði og kostnaður toga í sömu átt — bæði leiða þig út fyrir EU Data Boundary. Þegar tvö atriði benda í sömu átt er auðvelt að gleyma hinum tveimur.
Spurning til baka
Þegar gæði og verð draga þig í sömu átt — er fórnin á staðsetningu og öryggi meðvituð málamiðlun, eða gleymdust þessi atriði einfaldlega af því að enginn staldraði við?
Engin leið er rétt eða röng — vægið ræðst af því hvað þú ert að gera, hvaða gögn þú vinnur með og hvaða umhverfi þú starfar í. Mundu að staðsetning innan EU er ekki það sama og að gögnin séu utan bandarískrar lögsögu. APRÓ ehf. · apro.is

Gæðin toga þig út fyrir Evrópu. Claude er orðið eitt öflugasta módelið í kóðun og þeir sem hafa prófað það vilja sjaldnast skipta og sama gildir um Cowork. En um leið og þú vilt nýta það til fulls leiðir gæðakrafan þig oft beint út fyrir evrópska lögsögu, því eins og þessar fimm greinar hafa sýnt er öll Claude upplifunin ekki alltaf í boði innan EU Data Boundary. Þarna togast gæði á við staðsetningu: viltu besta tólið eða viltu halda gögnunum heima?

Kostnaðurinn togar þig á sama stað. Þegar notkun er lítil skiptir þetta minna máli en strax og hún vex fer getur kostnaðurinn farið að bíta og þá fer maður ósjálfrátt að leita leiða til að lækka hann. Mánaðarleg áskrift beint hjá Anthropic er oft ódýrari en að keyra sömu vinnslu á evrópskum innviðum gegnum Bedrock eða Vertex og þar með togar kostnaður þig út fyrir EU - sömu leið og gæðin gerðu af annarri ástæðu. Ódýrara og betra benda í sömu átt: vestur og þegar tvö atriði toga í sömu áttina er auðvelt að gleyma hinum tveimur.

Vistkerfið sem þú tilheyrir togar á móti. En svo er hin myndin, sem togar í gagnstæða átt: að velja einn birgja og láta vistkerfið sem fyrirtækið tilheyrir ráða. Hér heima er það oftast Microsoft og það er ekki vegna þess að það sé ódýrasti kosturinn. Það er vegna þess að sérfræðingarnir þínir kunna á þann stakk, það er gnægð þjónustuaðila sem þekkja hann og ríkið skuldbatt á sínum tíma stofnanir til að nota þær lausnir í nafni sparnaðar þannig að útbreiðsla er mjög mikil. Þá vegur þyngra að halda öllu á einum stað, innan umhverfis sem þú þekkir og treystir, en að elta besta eða ódýrasta módelið hverju sinni. Þetta er gild ákvörðun um öryggi og umhverfi en ekki endilega um verð eða gæði og það er mikilvægt að rugla því ekki saman.

Samhliða þessu spilar inn í vaxandi pólitískur og siðferðilegur núningur. Það gætir vaxandi óþæginda í garð þess hve mikið vald er samþjappað hjá bandarískum tæknirisum. Þetta snýr annars vegar að siðferðislegum hliðum, eins og háværum deilum um höfundarréttarbrot þar sem mörgum finnst vegið að eigin hugverkum og sköpun og hins vegar að breyttu alþjóðlegu landslagi. Harðari tónn í utanríkismálum og hótanir í garð nágrannaþjóða skapa undirliggjandi óvissu um áreiðanleika til lengri tíma. En þótt menn finni greinilega fyrir þessari áhættu, veldur tæknilega læsingin (e. vendor lock-in) því að fyrirtæki loka augunum, fylgja straumnum og vona að skýjarisarnir haldi sig utan þessara mála á alþjóðlegum vettvangi. Það er þó komin reglugerð í Evrópu sem vinnur gegn þessari læsingu sem á eftir að innleiða á Íslandi, EU Data ACT.

Þessi óvissa er ekki bara fræðileg eða sterk tilfinning lengur. Ég skrifaði þessar greinar fyrir nokkrum vikum, áður en Fable kom út sem er öflugasta Claude-módelið til þessa en Bandaríkjastjórn lokaði aðgengi að því fyrir alla nema bandaríska ríkisborgara eftir aðeins nokkra daga. Sú þróun bætir enn einni hliðinni við: það er ekki sjálfgefið að við fáum yfirhöfuð aðgang að bestu módelunum á Íslandi. Ef pólitíkin vestan hafs fer að ráða því hvaða markaði skýjarisar mega þjónusta, þá snýst þetta ekki lengur bara um hvar gögnin okkar liggja, heldur hvort öflugustu módelin standi okkur til boða til að byrja með.

Þar erum við komin að örygginu, sem getur verið lúmskt þegar ný tól rjúfa þann ramma sem fyrir er. Segjum að fyrirtækið hafi byggt allt sitt í kringum AWS eða Microsoft: aðgangsstýringu, eftirlit og áhættumat svo bætir þú Anthropic beint við af því gæðin eða kostnaðurinn toguðu þig þangað, þá stendur sú vinnsla allt í einu fyrir utan þann ramma sem þú varst búinn að byggja. Þú ert farinn að treysta á að allt í kringum hana sé í lagi, frekar en að vita það.

Og þetta tengist beint vinnslusamningnum sem ég byrjaði alla seríuna á. Því svona byrjar þetta oftast: nokkrir forritarar fá að prófa Anthropic beint, samningurinn er lesinn einu sinni í upphafi - ef hann er þá lesinn - og svo ekki oftar. Eða tölvudeildin setur lausnina í “prófanir” innanhús hjá völdum notendum. Það gengur vel og þá skellur á stormur: fleiri og fleiri vilja nota hana. En allan tímann situr hún til hliðar við allt annað, utan formlega rammans, utan áhættumatsins, með vinnslusamning sem enginn hefur litið á síðan í byrjun. Þetta er ekki vegna þess að einhver hafi ákveðið að sniðganga öryggið frekar að lausnin óx hraðar en umgjörðin utan um hana.

Niðurstaðan er ekki að ein leið sé rétt og önnur röng. Það er engin ein rétt stilling á þessum atriðum og vægið fer eftir því hvað fyrirtækið er að gera, hvaða gögn er verið að vinna með og hvaða umhverfi er starfað í. Fyrirtæki í fjármála- eða heilbrigðisgeiranum hafa ekki sama svigrúm og önnur fyrirtæki sem vinna með opin gögn. Umhverfið ræður ekki bara hvað þú ættir að velja, heldur hvað þú getur yfirhöfuð leyft þér. Verkið er að stilla togstreituna af meðvitað, eftir þínum aðstæðum og ekki að láta eitt atriði ráða og vona það besta.

Það sem ég myndi vilja sjá í samtalinu

Ef ég fengi tillögu eða tilboð í dag, hvort sem það er frá verktaka eða eigin tölvudeild, myndi ég vilja sjá þrennt og ekkert af því ætti að vera ósanngjarnt að biðja um:

  • Skýra mynd af því hvert gögnin mín fara.  Hvaða skýjarisa á að nota, hvaða svæði, hvaða undirvinnsluaðilar koma að málinu, hver hefur aðgang að hverju og hvort EU Data Boundary gildi í raun fyrir þetta tiltekna módel en ekki fyrir skýið almennt. (Vegvísirinn í hluta 3 sýnir þetta fyrir hverja leið).

  • Skýra afstöðu til gervigreindar í kóðun verkefnisins. Hvaða tól, hvaða módel undir, hvar þau keyra og hvernig kóðabútarnir mínir og raunveruleg gögn eru meðhöndluð í þróun, hver á að bera kostnaðinn við gervigreindartólin - nákvæmlega það sem hluti 5 fjallaði um. (Áhættumat í hluta 5 gefur hugmynd af núverandi stöðu).

  • Rök fyrir vali módels. Ekki „við notum X af því að það er gott", heldur samanburð á að minnsta kosti tveimur kostum þar sem öflin sem togast á eru vegin, gæði, kostnaður, staðsetning og öryggi,og hreinskilið svar um hvaða takmarkanir fylgja þeim kosti sem varð fyrir valinu. Því þeim fylgja alltaf takmarkanir.

Sá aðili, hvort sem það er verktaki eða eigin tölvudeild sem getur svarað þessu þrennu, hefur augljóslega hugsað málið til enda.

Ísland og spurningin um hvar

Ég ætla ekki að segja þér hvort gögnin þín eigi að liggja á Íslandi en greinarnar fjalla um skýjarisana sem eru ekki staðsettir hérna. Það er stærra samtal með fleiri hliðum en þessi grein ræður við - kostnaður, samkeppnishæfni, raforka, sjálfbærni, höfundarréttur, regluverk eins og EU AI & Data ACT og áhættan sem fylgir að treysta á þessa skýjarisa utan eigin lögsögu. En það er samtal sem er í gangi og á að vera það.

Maður reynir að meta þessi mál út frá nokkrum atriðum og það er einmitt það sem aðgreinir upplýstan kaupanda frá þeim sem lætur eitt atriði ráða og vonar það besta. Þú þarft ekki að komast að sömu niðurstöðu og ég. En þú þarft að spyrja spurninganna og þú þarft að gera það áður en gögnin þín  fara á flakk, ekki eftir á.

Hvar eru gögnin þín? Hver sér þau? Hvar keyrir módelið? Er EU Data Boundary virkt fyrir þetta tiltekna módel? Hvers konar endapunkt erum við að nota og hvað gerist þegar álagið eykst? Hvaða tól notar verktakinn og hvernig fer hann með kóðann minn? Hver ber kostnaðinn af gervigreindartólunum og notkuninni?

Ef spurningin fær ekki svar, þá er það svarið sem þú þarft. Það þýðir að einhver er að horfa í hina áttina.

Og þá er einmitt tíminn til að snúa sér við og kíkja.

——————————————————————————————————

Þetta var lokahluti af sex. Ef þú hefur ekki lesið hluta 1 til 3 (staðreyndirnar og yfirlit yfir allar leiðir), hluta 4 (afleiðingarnar - ábyrgð kaupanda eða hluta 5 (gögn sem leka gegnum kóða), þá mæli ég með að renna yfir þær líka. Greinarnar mynda saman þá heildarmynd sem þessi lokahluti byggir á.

Loforðið heldur ekki af sjálfu sér. Ef það á að halda þarf að hafa fyrir því - spyrja réttu spurninganna, kalla á gegnsæi frá þjónustuaðilanum þínum, og á endanum taka ábyrgð á eigin gögnum frekar en að treysta því að einhver annar sé búinn að hugsa málið til enda. Það er enginn annar sem gerir það fyrir þig áður en smellt er á næsta hak.


Hafðu samband