Diogelu preifatrwydd yn oes deallusrwydd artiffisial (AI): Archwilio potensial modelau iaith mawr mewn llwythi gwaith sy’n ymdrin â data sensitif
12 Mawrth 2024Mae ein tirwedd ddigidol yn esblygu’n gyflym, ac ni fu diogelu ein data personol erioed mor bwysig. Yn y blog hwn, mae Dr Will Webberley, Cyfarwyddwr a Phrif Swyddog Technoleg, a Dr John Barker, Cyfarwyddwr Cyswllt Arloesedd, yn SimplyDo, yn trafod eu gwaith yn y maes hwn, ac yn disgrifio sut mae mewnbwn gan arbenigwyr yn Hyb Caerdydd Canolfan Hartree ym Mhrifysgol Caerdydd. wedi cyfoethogi eu busnes.
Mae ein tîm SimplyDo yn gweithio yn sbarc|spark a’i nod yw cynyddu ein galluoedd ym maes deallusrwydd artiffisial cynhyrchiol (AI) drwy fodelau iaith mawr (LLMs). Mae cynnyrch craidd ein cwmni, sef platfform ar gyfer galluogi newid arloesol drwy arloesi ar sail heriau i sefydliadau menter mawr, wedi bod yn manteisio ar AI ar gyfer tasgau pwysig i arbed amser a phrosesu data allweddol ers nifer o flynyddoedd.
Yn ddiweddar, cawsom y cyfle i weithio ar raglen “Cynorthwyo” hynod lwyddiannus gydag arbenigwyr yn Hyb Caerdydd Canolfan Hartree, ym Mhrifysgol Caerdydd. Mae wedi ein galluogi i ddatblygu’r technolegau hyn ymhellach o ran eu galluoedd a’u cymhwysedd i’r farchnad, yn ogystal ag ehangu ein dealltwriaeth ymarferol o’r sefyllfa gyfoes o ran AI.
Pwysigrwydd diogelwch data
Gan fod ein cwsmeriaid yn dod o ddiwydiannau hynod sensitif, megis amddiffyn, plismona, a gofal iechyd, mae diogelwch data a sofraniaeth yn ffactorau hanfodol i’w hystyried ym mhopeth a wnawn yn SimplyDo. O ran diogelwch, rydym yn gwneud yn siŵr bod llifoedd data yn cael eu rheoli’n llawn ac yn rhagweladwy, a bod data cwsmeriaid yn cael ei ddiogelu’n briodol wrth bob cam prosesu ac ym mhob cydran. Drwy wneud hyn, gallwn warantu mai dim ond ar adegau ac mewn sefyllfaoedd priodol y bydd y data ar gael.
Mae gofynion sofraniaeth nid yn unig yn mynnu bod cwsmeriaid yn parhau i fod â rheolaeth lwyr dros eu data eu hunain trwy ein gwasanaethau. Mae hefyd yn golygu bod rhaid i’r data gael ei brosesu a’i storio’n llawn mewn lleoliadau daearyddol a rhithwir y cytunwyd arnynt ymlaen llaw. Er enghraifft, mae llawer o’n cwsmeriaid yn mynnu bod eu data’n cael ei reoli’n llawn yn y DU yn unig – gan gynnwys yr holl gydrannau, o weinyddion a chronfeydd data i systemau ebost.
Tirwedd gyfnewidiol AI
Gan ystyried hyn oll, mae’n rhaid i ni bob amser ystyried yn ofalus y technolegau, y prosesau, a’r darparwyr yr ydym yn eu hadeiladu ac yn gweithio gyda nhw i wneud yn siŵr y gellir diwallu’r anghenion hyn. Mae’r byd wedi gweld twf anferthol a chyflym mewn AI cynhyrchiol ar draws ystod o gyfryngau dros y blynyddoedd diwethaf, gan gynnwys testun, delweddau, llais, a hyd yn oed fideo. Mae llawer o sefydliadau wedi bod yn rhuthro i fanteisio ar y technolegau cyffrous hyn i rymuso eu gwasanaethau eu hunain, neu hyd yn oed adeiladu categorïau cwbl newydd a chynhyrchion annibynnol nad oeddent yn bosibl yn flaenorol.
Hyd yma, dim ond ychydig o wasanaethau sydd wedi bod yn gyrru’r rhan fwyaf o’r math hwn o allu a welir yn y farchnad. Mae llawer o fusnesau’n dewis defnyddio’r cyfleusterau sydd ar gael trwy OpenAI a hyper-broseswyr, megis Amazon Web Services a Google Cloud. O ystyried yr arbenigedd, yr amser, y gost, a’r cymhlethdod cyfrifiannol sy’n gysylltiedig â hyfforddi a defnyddio’r mathau o fodelau sydd eu hangen ar gyfer datrysiadau AI cynhyrchiol a modern, nid yw’n anodd dychmygu pam mae hyn yn well na cheisio creu eich dull eich hun.
Taro cydbwysedd rhwng hwylustod a diogelwch
Yn SimplyDo, rydym wedi bod yn datblygu nifer o atebion fel prawf cysyniad yn rhan o’n cynhyrchion. Mae’r rhain wedi’u hadeiladu drwy ddefnyddio sylfaen o dechnolegau gan GPT OpenAI a gwasanaethau AI Google. Ategwyd nodweddion o’r fath gan lwythi gwaith sy’n hynod nodweddiadol o systemau LLM – megis cynhyrchu testun, dealltwriaeth semantig, a chrynhoi. Fe’u hadeiladwyd mewn meysydd y dangoswyd yn glir eu bod yn darparu buddion gweithredol go iawn ac yn arbed llawer o amser wrth reoli data a deall signalau gwybodaeth ar raddfa. Fodd bynnag, byddai cynhyrchu’r datblygiadau hyn yn llawn ‘fel y maent’ yn creu sawl her o ran ein cyfrifoldeb i ddata cwsmeriaid.
Er mor hwylus yw gwasanaethau AI y gellir eu prynu, mae ansicrwydd mewn cysylltiad ag i ba raddau y gellir cadw’r data yn gyfrinachol wrth ymdrin â mewnbynnau data y tu ôl i’r llenni. Er enghraifft, wrth grynhoi testun nodweddiadol, byddai angen i SimplyDo ddatgelu data cwsmeriaid er mwyn iddo gael ei brosesu gan y gwasanaeth, ac nid yw bob amser yn glir sut y bydd data o’r fath yn cael ei brosesu. Ar hyn o bryd, mae rhai gwasanaethau’n ailddefnyddio data mewnbwn at ddibenion ailhyfforddi (gan olygu y gallai’r data gael ei ddatgelu mewn modelau dilynol), mewnbynnau logio (er mwyn archwilio neu am resymau eraill), neu’n gwneud unrhyw beth arall gyda’r data gan olygu ei fod ar gael fel arall neu’n ehangach.
I lawer o gwmnïau, yn enwedig y rhai sydd â chynhyrchion sy’n wynebu defnyddwyr, nid yw hyn yn broblem, oherwydd gellir datgan y bwriad i ddefnyddio gwasanaethau o’r fath ymlaen llaw neu mewn hysbysiadau preifatrwydd. Fodd bynnag, i ni, byddai ansicrwydd o’r fath yn amharu ar ein gallu i ddiogelu data ein cwsmeriaid yn hyderus o ran diogelwch a sofraniaeth.
Ein Profiad o ‘Gynorthwyo’
A ninnau’n gwybod am y manteision y gallai AI eu cynnig i’n cwsmeriaid, yn ogystal â’r heriau a nodwyd gennym wrth ddod â galluoedd o’r fath i’r farchnad, roedd y posibilrwydd o weithio ar raglen “Cynorthwyo” gyda Hyb Caerdydd Hartree yn gyfle euraidd i yrru’r gwaith o wireddu ein strategaeth Al. Y nod oedd cyfoethogi dealltwriaeth y tîm cyfan o’r maes a sut y gallem ddefnyddio technolegau o’r fath yn ddiogel ac yn foesegol er budd ein cwsmeriaid.
Mae “Cynorthwyo” yn ddarn 12 awr o waith a arweinir gan Hyb Caerdydd Canolfan Hartree. Mae modd cynnal y gwaith mewn sawl ffordd, ond yn ein hachos ni, roeddem yn gallu cymryd rhan mewn nifer o sesiynau byr ar ffurf gweithdy wyneb yn wyneb, lle buom yn disgrifio ein heriau (a’n cyfle) o fewn cyd-destun achosion defnydd penodol. Roedd y gwyddonwyr data yn yr Hyb yn amlwg yn brofiadol iawn ac yn meddu ar arbenigedd cryf mewn ystod eang o raglenni AI. Ar ben hynny, roedd eu dealltwriaeth fanwl o’r dechnoleg ei hun, a’i photensial a’i pheryglon, yn amlwg.
I ni, trosglwyddo swm sylweddol o wybodaeth oedd y prif ddeilliant. Erbyn diwedd y gwaith “Cynorthwyo”, roedd dealltwriaeth ein tîm wedi cynyddu’n aruthrol – i’r graddau y byddai gennym y wybodaeth a’r gallu i ddefnyddio a chynnal ein modelau ein hunain a deall sut i gymhwyso gwahanol fathau o fodelau a chyfaddawdu o ran cymhlethdod (e.e. paramedrau) a chost gyfrifiannol. Ysgrifennodd yr Hyb gôd sampl i ni hefyd er mwyn helpu i ddangos rhai o’r trafodaethau lefel isel a gawsom yn ystod y gwaith “Cynorthwyo”.
Rydym yn hynod ddiolchgar o fod wedi cael y cyfle i weithio gyda Hyb Caerdydd Canolfan Hartree. Drwy gydol y profiad, roedd y tîm yn hynod bositif, yn barod i wrando, ac yn deall ein heriau. Roeddent yn gallu ein helpu drwy rannu arbenigedd perthnasol ac ymarferol yr ydym eisoes wedi gallu ei ddefnyddio wrth ddatblygu a defnyddio AI yn ein cynnyrch. Gyda lwc, byddwn yn gallu parhau i weithio gyda’r Hyb yn y dyfodol yn rhan o brosiect tymor hwy i allu cynnal archwiliad manwl ac ymarferol pellach.
Ynglŷn â Hyb Caerdydd Canolfan Hartree
Hyb rhanbarthol o Ganolfan Genedlaethol Hartree ar gyfer Arloesedd Digidol yw Hyb Caerdydd Canolfan Hartree. Fe’i hariennir gan y Cyngor Cyfleusterau Gwyddoniaeth a Thechnoleg.
Mae’r Hyb yn bartneriaeth rhwng cydweithwyr ym Mhrifysgol Caerdydd, gan gynnwys y rhai o sefydliadau arloesedd blaenllaw’r brifysgol, y Sefydliad Arloesedd Trawsnewid Digidol a’r Sefydliad Arloesedd Diogelwch, Troseddu a Cudd-wybodaeth.
Mae’r Hyb yn paru arbenigedd academaidd â busnesau bach a chanolig yng Nghaerdydd a’r cyffiniau sydd am ddeall yn well sut y gall arloesedd digidol drawsnewid cynhyrchiant busnesau bach a chanolig, cryfhau eu cydnerthedd a gwella eu twf.
Mae’r hyb yn adeiladu ar gymuned ymchwil ac arloesedd AI, gwyddorau data a chyfrifiadura o’r radd flaenaf Mhrifysgol Caerdydd ac mae’n manteisio ar gael mynediad uniongyrchol at glystyrau busnesau bach a chanolig Prifddinas-Ranbarth Caerdydd a Phorth y Gorllewin.
Mae gan dîm yr Hyb brofiad uniongyrchol a helaeth o ymgymryd ag ymchwil a datblygu arloesol a arweinir gan effaith wrth gydweithio, ac mae ganddynt berthnasoedd cryf â byd diwydiant a dulliau sicr a chadarn o ymgysylltu â fusnesau bach a chanolig.
Mae’r hyb ym Mhrifysgol Caerdydd yn un o dri ledled y DU i gael cyfran o £4.5 miliwn yn rhan o raglen Canolfan Genedlaethol Arloesedd Digidol Hartree. Bydd y safleoedd, sydd hefyd ym Mhrifysgol Newcastle a Phrifysgol Ulster, yn cael eu hariannu am dair blynedd i sefydlu rhwydwaith i helpu gyda mabwysiadu digidol a fydd ar gael yn hawdd ac yn lleol i fusnesau bach a chanolig ledled y DU.