Samfélagsmiðlar torvelda safninu að fanga tíðarandann

Mynd: Wikipedia / Wikipedia
Vefsöfnunartól Landsbókasafns Íslands nær einungis að fanga hluta samfélagsumræðu dagsins í dag því samfélagsmiðlar leyfa því ekki að taka afrit. Gamlar bloggsíður verða aftur á móti varðveittar um ókomin ár. 

Vefsafn Landsbókasafnsins tekur reglulega afrit af íslenska internetinu eins og það leggur sig og hefur gert í tæp 20 ár. Það heldur til dæmis utan um fjölda bloggsíðna frá árdögum bloggsins. Á gömlum blog.central.is slóðum má til dæmis finna ýmsa fjársjóði.

Blog.central.is/

„Já þá er kominn tími á smá blogg. Síðasta helgi var bara róleg hjá okkur fjölskyldunni, við gerðum ekkert á föstudaginn og svo fórum við í sumarbústað hjá ömmu og afa Jóns,“ skrifaði Anna nokkur á bloggsíðu sína árið 2006. 

Sama ár lýsti menntaskólastrákur áformum sínum um að verða töff ellilífeyrisþegi.

„Ég ætla koma mér vel fyrir á einhverju topp elliheimili, klæðast leddara vesti, kúrekastígvélum og vera með sítt að aftan.
Ætla sko ekki að vera eins og flestir gamlingjar sem japla á kjálkanum á sér og telja brúnu flekkina á handarbakinu á sér allan daginn, og horfa á matlock eða Gísla Martein á kvöldin.“

Fólk velti fyrir sér draumförum, nú eða lýsti kreppuraunum.

„Það hlaut að koma að því að kreppan myndi ná mér! Hún hefur hingað til ekki haft nein bein áhrif á mitt daglega líf þar sem ég er ekki með nein lán og á enga digra sjóði. í dag fékk ég mér í mesta sakleysi kaffi í háskólabíó og ætlaði mér að setja lok á plastbollann því ég ætlaði að hafa hann með mér inn í tíma en viti menn! Það voru engin lok og konan sagði að þau væru ekki til á landinu, vöruskorturinn farinn að segja til sín!“ 

Landsbókasafnið geymir þetta allt og miklu meira til.

Mynd með færslu
 Mynd: Pexels

Kristinn Sigurðsson er yfirmaður stafrænna verkefna og þróunar á safninu. „Þetta á endanum snýst um að uppfylla hlutverk okkar sem skylduskilasafn, safn sem á að þaulsafna útgefnu efni. Það voru sett lög 2002 sem útvíkkuðu þetta frá prentuðu efni yfir í alls konar rafrænt efni, þar með talið náttúrulega það sem kemur út á internetinu. Við höfum verið að safna því með það fyrir augum að þessi hluti menningararfleifðarinnar týnist ekki.“

Milljarðar vefsíðna geymdir niðri í kjallara

Safnið telur nú um fimm til sex milljarða vefsíðna og það bætist sífellt í enda sífellt verið að taka afrit af íslenskum vefsíðum. Fréttavefur RÚV er þannig til í 130 þúsund eintökum og er ein mest afritaði vefsíða landsins, tekið afrit af forsíðunni í hvert sinn sem ný fréttafærsla bætist við. Kristinn segir að farið hafi verið að afrita fréttavefi tíðar þegar í ljós kom að sjaldan höfðu verið tekin afrit af vefmiðlunum þegar sögulegar hrunfréttir voru á forsíðum þeirra.

Mynd með færslu
 Mynd: vefsafn/mbl.is
Ein af forsíðum mbl.is í október 2008.

Það kostar auðvitað að hýsa þetta allt. „Þetta hleypur orðið á nokkrum milljónum á ári og vex frá ári til árs, við erum með eitt afrit hérna niðri í kjallara í Þjóðarbókhlöðunni sem er hýst á okkar vélbúnaði. Við erum með annað heildarafrit hjá íslenskum skýjaþjónustuaðila þar sem við erum með þjónustusamning og við erum að vinna að því að útbúa þriðja neyðarafritið sem myndi vera hjá erlendum skýjaþjónustuaðila til að tryggja öryggið, jafnvel þó eitthvað komi upp hér innanlands,“ segir Kristinn. 

Samfélagsmiðlarnir girða fyrir aðgang

Landsbókasafninu gekk ágætlega að ná utan um samfélagsumræðuna á netinu hér áður fyrir en nú er staðan breytt. Hreinskiptnar bloggfærslur í opnu aðgengi heyra að mestu sögunni til. Stjórnmálaumræða og almennt dægurþras hefur á síðustu 15 árum færst í auknum mæli inn á samfélagsmiðla. Þar hafa farið fram ótal myllumerkjaherferðir á Twitter, til dæmis #metoo og #kæraeygló.

Þessu efni geta vefsöfnunartól Landsbókasafnsins ekki safnað.

Mynd með færslu
 Mynd:  - Pexels

„Því miður, nei. Facebook, Instagram og allir þessir samfélagsmiðlar eru hannaðir til að koma í veg fyrir að hægt sé að safna efni af þeim með skipulögðum hætti. Þeir nota alls konar tæknilegar ráðstafanir,“ segir Kristinn. 

Samfélagsmiðlarnir séu ekki eins og sumir vefir sem er erfitt að safna af vegna þess að þeir eru óheppilega hannaðir heldur reyna fyrirtækin gagngert að koma í veg fyrir hvers konar gagnasöfnun.

„Upplýsingarnar sem þau geyma eru náttúrulega þeirra helstu viðskiptaverðmæti,“ segir Kristinn.  

 

Það væri hægt að safna efninu handhægt, en safnið hefur ekki mannafla í það. 

„Okkar venjulegu vefumsjónartól safna hundruðum slóða á hverri sekúndu, hitt fyrirkomulagið er miklu hæggengara og tímafrekara, þá ertu að safna einni og einni slóð, á sama hraða og þú vafrar um netið.“

En er þetta vandamál að ekki náist að safna efni af samfélagsmiðlum?

„Það er það allavega að nokkru leyti, það má deila um hvort margt af þessu sem gerist á samfélagsmiðlum fellur undir útgefið efni, gjarnan er fólk bara að tala í sínum vinahópi og það er fyrir utan okkar söfnunarskyldu en þegar stjórnmálaflokkar eru með Facebook-síður þá er þar efni sem ætti að safna og það er mjög óheppilegt að geta ekki gert það með neinu góðu móti.“

Þetta á líka við um efni frá einstaka pólitíkusum, fyrirtækjum og stofnunum. 

 

Þjóðskjalasafnið meðvitað - engin lausn í sjónmáli

Það er ekki einu sinni víst að kommentakerfin lifi áfram í vefsafni bóksafnsins því þau eru oft drifin áfram af Facebook. 

Þjóðskjalasafnið er líka meðvitað um vandann, systursöfn þess á Norðurlöndum væru eitthvað farin að safna færslum frá frambjóðendum, í tengslum við kosningar, en hér hefur það skref ekki enn verið stigið. 

Landsbókasafnið hefur ekki leitað til samfélagsmiðlanna til að ráða bót á þessum vanda. „Við höfum bara heyrt óformlega frá erlendum kollegum þar sem hefur verið reynt að opna á umræður um þetta að þeir raunverulega fá engin svör, það eru engir sjáanlegir hagsmunir fyrir þessa risa að opna á gögnin með neinum hætti þannig að ég sé ekki í fljótu bragði að við getum knúið fram neitt.“

Fá mikið af rusli í netið en brýnt að safna núna

Kristinn hefur ekki yfirsýn yfir það hvort margir séu að grúska í gömlum bloggum eða fletta upp margra ára forsíðum fréttamiðla. Til þess þarf fólk í dag að muna vefslóðina. Það er nefnilega ekki hægt að nota textaleit í vefsafninu og kannski margir þakklátir fyrir það að bernskuhugleiðingar á bloggum séu ekki auðfinnanlegar með einfaldri leit. 

Abstrakt mynd sem táknar internetið.
 Mynd: CLUC - Freeimages

Markmiðið er að í framtíðinni verði hægt að koma skikki á alla þessa milljarða vefsíðuafrita, nota leitarorð og flokka. Núna segir Kristinn mikilvægast að safna efninu, þó mikið af því sé sennilega lítils virði, annars glatist það nefnilega. „Það er eðli málsins samkvæmt að við fáum meira af rusli en því góða, maður kastar breiðu neti og svo verður kannski að vinsa úr því í framtíðinni.“

24.11.2021 - 17:28