Inleiding
Die era van grootdata bied ongekende uitdagings vir tradisionele argiewe. Die geweldige volume, verskeidenheid en snelheid van digitale inligting wat gegenereer word, oorweldig bestaande infrastrukture en metodes. Argiewe, veral dié wat kleiner taalgemeenskappe soos die Afrikaanssprekende-gemeenskap bedien, worstel om tred te hou met die vloed van digitale inhoud, wat wissel van sosiale media-plasings tot akademiese artikels. Hierdie uitdagings word vererger deur beperkte befondsing en personeel, wat die vermoë van argiewe om hierdie waardevolle kulturele erfenis te bewaar en toeganklik te maak, belemmer.
In hierdie artikel word 'n kort beskrywing verskaf van die uitdagings wat argiewe in die gesig staar teen die agtergrond van grootdata, en die potensiaal van groottaalmodelle word bespreek.
Uitdagings
Die veranderende inligtingsomgewing waarbinne ons tans beweeg word gereeld na verwys as 'n grootdata-omgewing, wat gekenmerk word deur hoofsaaklik drie v's: die eksponensiële groei van digitale data in volume, die verskeidenheid van dataformate, en die snelheid (velocity) waarteen data gegenereer word en verander (Senekal en Brokensha, 2014). Hierdie drie fasette van 'n grootdata-omgewing bied aansienlike uitdagings vir tradisionele argiewe.
Eerstens is die blote volume digitale inligting, van akademiese publikasies en nuusplatforms tot sosiale media, oorweldigend. Selfs in Afrikaans het die hoeveelheid publikasies toegeneem, byvoorbeeld deur aanlyn nuus- en gespeksplatforms soos Maroela Media en LitNet, sowel as 'n groot hoeveelheid persoonlike blogs. Wanneer publikasies in Engels bygetel word - want 'n groot hoeveelheid publikasies wat Afrikaans en Afrikaanssprekendes raak word in Engels gepubliseer - dan word volumes nog moeiliker om te hanteer. Tradisionele metodes soos die druk en berging van fisiese kopieë is onvolhoubaar en onprakties wanneer met sulke volumes gekonfronteer word, omdat druk- en bergingskoste en personeelkostes vir die versameling en ontsluiting van materiaal buitensporig hoog word. Boonop is daar oor die algemeen minder fondse beskikbaar vir argiewe, wat beteken dat minder personeel voor 'n groter berg materiaal te staan kom. Die enigste werkbare manier vir 'n klein gemeenskap soos die Afrikaanssprekende gemeenskap - wat boonop beperkte staatsfondse beskikbaar het vir kultuurbewaring - om sy erfenis te bewaar, is om materiaal digitaal te stoor en te ontsluit.
Tweedens kom digitale materiaal in verskeie formate voor, insluitend teks, beelde, oudio en video. Dink byvoorbeeld aan skrywersonderhoude en dokumentêre op YouTube, podgooie van boekbekendstellings, en die groot hoeveelheid digitale foto's wat met slimfone geneem word. Hierdie verskeidenheid maak dit uitdagend om inligting effektief te organiseer, te berg en te herwin. Boonop is die mediums waarop hierdie materiaal deur die twintigste eeu gestoor is, gewoonlik dié wat die vinnigste onleesbaar geword het, byvoorbeeld oudio- en videokasette.
Derdens vereis die spoed waarteen materiaal geskep word en veranderinge plaasvind dat argiewe vinnig moet aanpas en nuwe strategieë ontwikkel om materiaal intyds vas te lê en te bewaar, en aan te pas by veranderende omstandighede. Wanneer daar meer verskyn as wat personeel kan stoor en ontsluit, raak personeel agter en word agterstande moeiliker om in te haal. Boonop is oplossings wat vandag werk, binnekort verouderd, wat beteken dat daar deurlopend aangepas moet word by ontwikkelinge.
Hierdie veranderinge noodsaak 'n verskuiwing van tradisionele argiveringspraktyke na meer innoverende en tegnologiegedrewe oplossings. Argiewe moet in digitale infrastruktuur belê en nuwe vaardighede en kundigheid ontwikkel (Senekal en Kotzé, 2018, 2024).
Oplossings
Tegnologie kan 'n baie bruikbare hulpmiddel vir die bestuur en ontsluiting van materiaal in 'n digitale argief wees. Selfs met 'n eenvoudige reëlgebaseerde stelsel kan materiaal byvoorbeeld op grond van reëls geliasseer word en kan kernwoorde toegeken word (Senekal en Kotzé, 2024). Die groot potensiaal kom egter in met groottaalmodelle, wat 'n vorm van Kunsmatige Intelligensie (KI) is. Groottaalmodelle is veral bekend deur ChatGPT, wat 'n gespreksagent is wat op die GPT-3.5 of GPT-4 goottaalmodelle werk, maar daar bestaan 'n groot verskeidenheid groottaalmodelle en maniere om van hulle gebruik te maak. Modelle se vermoë en beperkings verskil, en verbeter boonop vinnig, en daarom moet argiewe bekendheid verwerf met wat tans beskikbaar is en in watter rigting ontwikkelings plaasvind.
Een van die gevorderdste groottaalmodelle wat tans (2024) beskikbaar is, is Google se Gemini 1.5 Pro. Gemini se gevorderde vermoëns om groot hoeveelhede multimodale data (met ander woorde teks, beeld, oudio en video) te verstaan en te verwerk, en boonop oor taalgrense, maak dit 'n potensieel transformerende hulpmiddel vir digitale argiewe wat aan erfenisbewaring gewy is. Sy vermoë om uitgebreide teks-, oudio- en video-inhoud te hanteer, tesame met sy gesofistikeerde begrip en herroepvermoë, maak nuwe weë oop vir die bewaring en herlewing van kulturele erfenis.
Een van die sleuteluitdagings in erfenisbewaring is die hantering van bedreigde tale, wat dikwels nie voldoende dokumentasie of hulpbronne het nie. Gemini se vaardigheid in binnekonteksleer en vertaling, soos gedemonstreer deur sy vermoë om Kalamang uit beperkte linguistiese materiaal te leer (Reid et al., 2024), kan in hierdie verband instrumenteel wees. Deur oudio-opnames, mondelinge geskiedenisse en linguistiese tradisies te transkribeer en te vertaal, kan Gemini hierdie waardevolle hulpbronne toeganklik maak vir wyer gehore, en sodoende bydra tot die herlewing en bewaring van bedreigde tale. Dit beteken dat Gemini nie alleen Afrikaans, wat 'n klein taal is, kan hanteer nie, maar ook potensieel verskeie Afrikaanse dialekte.
Verder maak Gemini se vermoë om inligting van miljoene tekens van konteks oor verskeie modaliteite te verwerk en te herroep (Reid et al., 2024) voorsiening vir 'n beter begrip van uitgebreide historiese dokumente, videomateriaal en oudio-opnames. Dit kan navorsers en die publiek in staat stel om ryker insigte oor kulturele erfenis en historiese gebeurtenisse te verkry, wat 'n groter waardering vir die verlede kan skep. Gemini kan byvoorbeeld historiese tekste ontleed en gedetailleerde antwoorde op komplekse vrae verskaf, wat navorsing en opvoedkundige pogings aanhelp (Reid et al., 2024).
Nog 'n potensiële toepassing van Gemini lê in sy vermoë om gestruktureerde inligting uit ongestruktureerde data, soos beelde, te onttrek (Reid et al., 2024). Deur hierdie vermoë op historiese foto's en kunswerke toe te pas, kan Gemini die skepping van soekbare metadata fasiliteer, wat erfenisversamelings meer opspoorbaar en toeganklik vir gebruikers maak.
Die uitdaging is om hierdie vermoëns om te skakel in praktiese voordele, en daarom is dit nodig dat personeel in argiewe deeglike tegniese vaardighede en kennis moet hê.
Slot
Die digitale era bied beide uitdagings en geleenthede vir argiewe wat kulturele erfenis bewaar. Terwyl die groot volume, verskeidenheid en snelheid van digitale data aansienlike struikelblokke bied, bied tegnologie deur groottaalmodelle soos Gemini belowende oplossings. Deur hierdie KI-gedrewe instrumente te benut, kan argiewe hul praktyke moderniseer, doeltreffendheid verbeter en uiteindelik die bewaring en toeganklikheid van waardevolle kulturele erfenis vir toekomstige geslagte verseker. Die sleutel tot sukses lê in die kombinasie van tegnologiese innovasie met die kundigheid en toewyding van argiefpersoneel, wat toegerus moet wees met die nodige tegniese vaardighede om hierdie kragtige instrumente te gebruik.
Verwysings
Reid, M., Savinov, N., Teplyashin, D., Lepikhin, D., Lillicrap, T., Alayrac, J., Soricut, R., Lazaridou, A., Firat, O., Schrittwieser, J., Antonoglou, I., Anil, R., Borgeaud, S., Dai, A., Millican, K., Dyer, E., Glaese, M., Sottiaux, T., Lee, B., Viola, F. en et al. 2024. Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context, arXiv. doi: 10.48550/arxiv.2403.05530.
Senekal, B. A. en Brokensha, S. 2014. Surfers van die tsunami: Navorsing en inligtingstegnologie binne die geesteswetenskappe. Bloemfontein: Sun Press.
Senekal, B. A. en Kotzé, E. 2018. Die ontwikkeling van ’n koste-effektiewe en byderwetse multimedia digitale argief by EPOG in Orania, LitNet Akademies Geesteswetenskappe, 15(3), pp. 239–275.
Senekal, B. A. en Kotzé, E. 2024. ’n Pyplyn vir die versameling, ontsluiting en beskikbaarstelling van materiaal vir die Nasionale Afrikaanse Letterkundige Museum en -Navorsingsentrum (NALN) se knipselversameling, Stilet, 35(2), pp. 38–62.