Nacionalna infrastruktura odprtega dostopa
Nacionalno infrastrukturo odprtega dostopa sestavljajo nacionalni portal, institucionalni repozitoriji slovenskih univerz, repozitorij samostojnih visokošolskih in višješolskih organizacij in repozitorij slovenskih raziskovalnih organizacij, ki niso del slovenskih univerz, ki omogočajo dostop do zaključnih del študija in publikacij raziskovalcev ter raziskovalnih podatkov.
Uporabnikom z vsega sveta so na voljo dvojezične spletne in mobilne aplikacije, priporočilni sistem ter funkcionalnosti za uporabnike s posebnimi potrebami. Mobilne aplikacije delujejo na operacijskih sistemih Windows Phone, Android in iOS. Uporabnikom je na voljo tudi sistem za detekcijo podobnih vsebin.
V okviru projekta ODUN, katerega smo končali konec avgusta 2013, smo na univerzah vzpostavili pravne podlage, ki omogočajo izvajanje procesov vstavljanja zaključnih nalog študentov in publikacij raziskovalcev. Kompatibilnost repozitorijev univerz s priporočili OpenAIRE omogoča Evropski komisiji preverjanje izpolnjevanja določil o obvezni odprti dostopnosti vseh objav iz sofinanciranih projektov v okvirnem programu Obzorje 2020.
Repozitoriji univerz so povezani s COBISS.SI in SICRIS ter so vključeni v evropski portal znanstvenih magistrskih ter doktorskih del DART-Europe in v različne imenike, agregatorje (OpenDOAR, ROAR, BASE, WorldCat …) ter iskalnike. Nacionalni portal agregira vsebine iz repozitorijev in drugih slovenskih zbirk (trenutno iz Digitalne knjižnice Slovenije, VideoLectures.NET, Arhiva družboslovnih podatkov, repozitorija SciVie, Revij ZRC SAZU in Digitalne knjižnice Ministrstva za obrambo) za potrebe skupnega iskalnika, priporočilnega sistema ter detektorja podobnih vsebin.
Spletne povezave:
Nacionalni portal: http://www.openscience.si/
Repozitorij Univerze v Ljubljani: https://repozitorij.uni-lj.si/info/index.php/slo/
Digitalna knjižnica Univerze v Mariboru: https://dk.um.si/info/index.php/slo/
Repozitorij Univerze na Primorskem: http://repozitorij.upr.si/info/index.php/slo/
Repozitorij Univerze v Novi Gorici: http://repozitorij.ung.si/info/index.php/slo/
Repozitorij samostojnih visokošolskih in višješolskih organizacij: http://revis.openscience.si/info/index.php/slo/
Repozitorij slovenskih raziskovalnih organizacij, ki niso del slovenskih univerz: http://dirros.openscience.si/info/index.php/slo/
Navodila za uporabo sistema za detekcijo podobnih vsebin najdete na https://dpv.openscience.si/navodila/
Najpomembnejše prednosti slovenske infrastrukture pred drugimi nacionalnimi infrastrukturami so:
- Repozitoriji univerz uporabljajo lastno programsko opremo, ki je integrirana z informacijskimi in avtentikacijskimi sistemi univerz, nacionalnim bibliografskim sistemom COBISS.SI, nacionalnim sistemom za vodenje evidence raziskovalnega dela SICRIS in nacionalnim portalom openscience.si.
- Detektor podobnih vsebin je vključen v proces oddaje zaključnih del študija in v oddajo del raziskovalcev.
- Priporočilni sistem omogoča priporočanje gradiv znotraj posameznega institucionalnega repozitorija in med institucionalnimi repozitoriji ter zunanjimi sistemi (VideoLectures.NET, DKMORS in dLib.si).
- Mobilne aplikacije za Android, IOS in Windows Phone ter vmesnik HTML5 omogočajo dostop do institucionalnih repozitorijev z mobilnih telefonov in drugih prenosnih naprav.
Na sliki je prikazana podrobnejša shema povezav posameznega institucionalnega repozitorija z drugimi sistemi.
Nacionalna infrastruktura odprtega dostopa je povezana s slovenskim bibliografskim sistemom COBISS.SI, ki nudi kakovosten nabor metapodatkov publikacij, katere se hranijo v institucionalnih repozitorijih univerz. Nacionalni portal in institucionalni repozitoriji izvajajo izmenjavo metapodatkov s COBISS.SI preko protokola SRU/SRW.
Programska oprema za institucionalne repozitorije temelji na programski opremi, ki jo uporablja Digitalna knjižnica Univerze v Mariboru in jo je razvila Univerza v Mariboru. Zaradi vzpostavitve različnih procesov oddaje publikacij s strani študentov in zaposlenih na univerzah je bila bistveno dopolnjena ter nadgrajena z novimi funkcionalnostmi.
Za potrebe procesov oddaje, hranjenja in katalogizacije publikacij je vsak institucionalni repozitorij povezan z avtentikacijskim sistemom univerze, univerzitetnim visokošolskim informacijskim sistemom in sistemom COBISS.SI.
Na Univerzi v Ljubljani se po shranitvi v repozitorij elektronske publikacije shranijo še v dokumentni sistem Univerze. Za sekundarno hranjenje publikacij in njihovih metapodatkov se uporablja nacionalni portal.
Institucionalni repozitoriji pošiljajo v nacionalni portal metapodatke in elektronske verzije publikacij takoj po izvedeni katalogizaciji v COBISS.SI. Iz nacionalnega portala pa repozitorij Univerze v Ljubljani pridobiva metapodatke in elektronske verzije publikacij iz ePrints.FRI, DRUGG, PeFprints in ADP. Prav tako institucionalni repozitorij iz nacionalnega portala pridobi dodatne podatke o raziskovalcih in raziskovalnih organizacijah, ki jih slednji črpa iz SICRIS-a.
Nacionalni portal izvaja priporočanje gradiv. Ob kliku na dokument v institucionalnem repozitoriju se iz nacionalnega portala pošlje v institucionalni repozitorij seznam podobnih dokumentov. Priporočilo je sestavljeno iz naslovov dokumentov znotraj institucionalnega repozitorija in naslovov dokumentov v drugih univerzitetnih repozitorijih, dLib.si, VideoLectures.NET in DKMORS.
Institucionalni repozitoriji omogočajo funkcionalnosti, ki so namenjene skrbnikom, in funkcionalnosti, ki so namenjene uporabnikom. Skrbniški del uporabljajo referenti v študijskih referatih, knjižničarji in skrbniki sistema in je različno zasnovan za posamezne univerze. Referenti izvajajo pregled in zaklepanje zaključnih del študentov. Knjižničarji pregledujejo publikacije študentov in zaposlenih, jih katalogizirajo v COBISS-u ter njihove metapodatke iz COBISS.SI prenesejo v institucionalni repozitorij. V skrbniškem delu lahko knjižničar metapodatke o publikaciji uvozi iz lokalne baze COBISS.SI in jim doda elektronsko različico publikacije. Na tak način je mogoče v repozitorij shraniti tudi publikacije, ki so že katalogizirane v COBISS.SI in zanje obstajajo elektronske različice ter ima univerza zanje ustrezno urejene avtorske pravice.
Uporabniški del institucionalnega repozitorija je razdeljen na del, ki je namenjen zainteresirani javnosti, in del, ki je namenjen prijavljenim uporabnikom (študentom in zaposlenim na univerzah; različna zasnova za posamezne univerze). Študenti in zaposleni na univerzah lahko po prijavi oddajo svoja dela v repozitorij ter pregledujejo svoje vsebine (metapodatke in podobna dela, ki jih je našel detektor podobnih vsebin). Del, ki je dostopen zainteresirani javnosti, je dvojezičen (slovenski in angleški uporabniški vmesnik) ter je dostopen preko spleta in na mobilnih platformah (Android, iPhone in Windows Phone). Spletna različica je prijazna do uporabnikov s posebnimi potrebami in vsebuje glavne značilnosti spletnih aplikacij, ki ustrezajo specifikaciji WAI. Spletni vmesnik omogoča uporabo invalidom z zmanjšano gibalno sposobnostjo in osebam, ki vidijo nekoliko slabše (npr. starejši in slabovidni).
Programska oprema omogoča enostavno in napredno iskanje ter brskanje. Članica univerze lahko prikaz vključi na svojo spletno stran tako, da kliče ustrezen JavaScript program ali uporabi JavaScript API za dostop do enostavnega ali naprednega iskanja ter brskanja po institucionalnem repozitoriju. Enak API uporabljajo tudi mobilne aplikacije. Članicam univerz in zaposlenim na univerzah je omogočen tudi izvoz metapodatkov o njihovih publikacijah v obliki RSS, JSON in RDF.
Institucionalni repozitorij prikazuje različne statistike, s pomočjo katerih lahko za vsako članico univerze ugotovimo celotno število njenih publikacij v repozitoriju in koliko jih je bilo shranjenih v zadnjem obdobju ter število vpogledov v posamezno publikacijo ali prenosov slednje. Za članice univerze so zanimive statistike, ki poročajo o številu ogledov in prenosov gradiv članice univerze za pretekla leta na letni ravni. Iz statistik mentorjev zaključnih del študija lahko ugotovimo, s katerimi somentorji slednji sodelujejo in katera zaključna dela študija so študenti izdelali pod njihovim mentorstvom. Zanimiva je tudi statistika, ki na podlagi ključnih besed publikacij mentorja posredno prikaže, s katerimi raziskovalnimi področji se slednji ukvarja in kako se je skozi časovno obdobje spreminjalo njegovo raziskovalno področje.
Proces oddaje zaključnega dela UM in UNG
Študenti univerz v Mariboru in Novi Gorici zaključno delo študija oddajo na vmesniku repozitorija, študenti univerz v Ljubljani in na Primorskem pa v študijski informatiki članice oziroma univerze.
Ko študent odda zaključno delo v institucionalni repozitorij Univerze v Mariboru ali univerze v Novi Gorici, institucionalni repozitorij pokliče storitev, ki za vse oddane dokumente preveri podobnost z drugimi deli. Storitev vrne povezavo na spletno stran, kjer lahko mentor, študent ali uslužbenec referata preverijo v kolikšni meri je delo podobno z drugimi. Prav tako si lahko iztiskajo poročilo o podobnosti z drugimi deli.
Ko je mentor na univerzi v Mariboru ali v Novi Gorici zadovoljen s končno različico zaključnega dela, lahko študent zaključi oddajo elektronske oblike zaključnega dela v institucionalni repozitorij, tiskano različico pa odda v študijski referat.
Slednji preveri istovetnost tiskane in elektronske različice zaključnega dela ter izjave, ki sta jih podpisala študent in mentor. To so izjave o vsebinski in oblikovni ustreznosti, istovetnosti tiskane ter elektronske verzije dela, o neizključnem prenosu materialnih avtorskih pravic in o določitvi embarga za prikaz dela na svetovnem spletu.
Po zagovoru zaključnega dela, knjižničar dobi tiskano različico publikacije in delo katalogizira v COBISS.SI.
Postopek oddaje s slikami je prikazan na https://dk.um.si/info/index.php/slo/oddaja-dela oz. na priponki https://dk.um.si/info/images/docs/postopek.oddaje.zakljucnega.dela.dkum.150722.pdf
Proces oddaje publikacije zaposlenega
Na vseh štirih univerzah smo za potrebe shranjevanja publikacij raziskovalcev vzpostavili enak proces. Raziskovalec lahko v institucionalni repozitorij shranjuje članke, poglavja ali sestavke v monografiji, prispevke na konferenci, monografije, visokošolske učbenike ali druga učna gradiva, patente, raziskovalne podatke in druge vrste publikacij. Vrste publikacij smo prilagodili tipologiji dokumentov za vodenje bibliografij v sistemu COBISS.SI. Del metapodatkov je različen za različne vrste publikacij. Raziskovalec se prijavi v institucionalni repozitorij, vpiše metapodatke in odda elektronsko različico gradiva ali uporabi metapodatke o katalogiziranem gradivu iz COBISS.SI.
Programska oprema institucionalnega repozitorija omogoča avtorjem gradiv tudi povezavo s portalom SHERPA/RoMEO, da lahko preverijo kakšno vrsto dostopa do elektronske različice članka v reviji lahko uporabijo glede na pogodbo o prenosu avtorskih pravic, ki so jo sklenili z založnikom. Prav tako vnašalcu metapodatkov ob vnosu imen in priimkov avtorjev programska oprema ponudi predloge avtorjev v bazi CONOR.SI. Avtor lahko za svoja dela vpiše nosilca avtorskih pravic in vrsto dostopa do celotnega besedila (takojšnja dostopnost na svetovnem spletu, odlog objave do poteka datuma embarga ali zaprt dostop) ter vpiše datum embarga. Zadnji navedeni metapodatki so del kompatibilnosti z navodili OpenAIRE, ki omogočajo, da strežnik OAI-PMH v institucionalnih repozitorijih vrača OpenAIRE kompatibilen XML, tako da lahko strežniki portala OpenAIRE zajemajo metapodatke o slovenskih publikacijah, ki so bile financirane s sredstvi EU ali drugih javnih financerjev.
Priporočilni sistem
Sistemi priporočanja so uveljavljeni predvsem na spletnih straneh, ki se ukvarjajo s prodajo izdelkov ali reklam. Vedno bolj se uveljavljajo tudi v institucionalnih repozitorijih. Glavni cilj teh sistemov je uporabnikom ponuditi vsebine, ki bi jih zanimale.
Obstaja več pristopov k priporočanju, ki jih delimo v dve skupini. Prvo skupino predstavljajo pristopi, ki delujejo izključno nad uporabniškimi aktivnostmi (Su in Khoshgoftaar, 2009). Raziskovalci, ki razvijajo algoritme, katerih vhod so uporabniške aktivnosti, analizirajo verjetnost, da bo uporabnik izbral neko vsebino, če so jo izbrali tudi drugi uporabniki, ki jih zanimajo podobne stvari. Najbolj razširjeni algoritmi so vezani na sodelovalno filtriranje (angl. collaborative filtering), pristope z binarnimi vektorji in algoritem SlopeOne. Druga skupina pristopov priporočanja deluje zgolj nad vsebino, uporabniške aktivnosti so postranskega pomena in se lahko uporabljajo za dodatne uteži pri razvrščanju rezultatov. Primeri algoritmov za priporočanje sorodnih vsebin so BM25, k najbližjih sosedov, latentna pomenska analiza (LSA) in drugi, ki so bili izpeljani iz podobnih predpostavk. Poleg tega se pristopi razlikujejo tudi glede na to, ali se priporočanje izvaja v realnem času (angl. memory based recommendation) ali pa so rezultati vnaprej pripravljeni in se enkrat ali večkrat dnevno na novo izračunajo (angl. model based recommendation) ali pa je uporabljen hibridni pristop (Bobadilla et al., 2013).
Priporočilni sistem v institucionalnih repozitorijih omogoča, da ima uporabnik ob prikazu metapodatkov izbranega dokumenta na voljo tudi informacije o dokumentih, ki so po vsebini podobni izbranemu dokumentu, pri čemer izločimo vse dokumente, ki so delni duplikati izbranega dokumenta. Delne duplikate določimo tako, da uporabimo rezultate primerjave podobnih povedi in znakovne primerjave, ki smo ju opisali v prejšnjem poglavju.
V programski opremi smo uporabili vsebinsko priporočanje dokumentov, ki deluje po algoritmu izračuna vrednosti BM25 in uporablja še dodatne uteži (Borovič, 2012), ki so pridobljene iz metapodatkov dokumentov in opazovanjem uporabnikovih aktivnosti. Algoritem deluje na naslednji način: najprej za vsako publikacijo nad metapodatki (avtorji, naslov, ključne besede, povzetek) in celotnim besedilom izvedemo lematizacijo ter pomensko označevanje besednih zvez, s pomočjo člankov iz Wikipedije in ključnih besed, ki smo jih dobili iz metapodatkov vseh publikacij v nacionalnem portalu (Burjek, 2011). Za te besedne zveze izračunamo njihovo število pojavitev v vseh dokumentih (TF) in inverzno frekvenco IDF, ki je vezana na pojavitev te besede v posameznem dokumentu. Večjo utež IDF damo besednim zvezam iz metapodatkov o publikaciji (avtorji, naslov, ključne besede in povzetek). Nato izračunamo podobnost z ostalimi dokumenti po formuli, ki so jo predlagali Robertson, Zaragoza in Taylor (Robertson et al., 2004). V izračunani matriki se nato izločijo tisti pari, ki imajo izračunano vrednost 0, saj to pomeni, da takšna dokumenta nimata skupnih lastnosti. Tako ostane le še seznam podobnosti, ki ga shranimo v podatkovno bazo. Postopek shranjevanja v podatkovno bazo je namenjen temu, da lahko ob zahtevi za priporočanje zelo hitro vrnemo ustrezne dokumente. Prag priporočanja dokumentov nastavimo glede na razliko vrednosti BM25 našega dokumenta z vrednostmi BM25 drugih dokumentov. Priporočanje sorodnih dokumentov je torej rezultat izbiranja N dovolj podobnih dokumentov iz seznama vrednosti BM25. Seznam priporočenih dokumentov je lahko tudi prazen, če priporočilni sistem ne najde podobnih dokumentov.
Vsebinsko priporočanje se v nacionalni infrastrukturi odprtega dostopa izvaja na nacionalnem portalu. Ob kliku na dokument v institucionalnem repozitoriju se z nacionalnega portala v institucionalni repozitorij pošlje seznam podobnih dokumentov. Priporočilo je sestavljeno iz naslovov dokumentov znotraj institucionalnega repozitorija in naslovov dokumentov v drugih digitalnih zbirkah (dLib.si, VideoLectures.NET in DKMORS).
Viri
Bobadilla, J., Ortega, F., Hernando, A. in Gutiérrez, A. (2013). Recommender systems survey. Knowledge-based systems, 46 (7), 109132. Pridobljeno 4. 6. 2014 s spletne strani: http://dx.doi.org/10.1016/j.knosys.2013.03.012.
Borovič, M. (2012). Sistem priporočanja dokumentov in analiza kvalitete vsebinskega priporočanja pri različnih obdelavah vhodnega besedila. Magistrsko delo. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. Pridobljeno 4. 6. 2014 s spletne strani: http://dkum.uni-mb.si/IzpisGradiva.php?id=37811.
Burjek, M. (2011). Wikifikacija vsebin v digitalni knjižnici UM. Diplomsko delo. Maribor: Fakulteta za elektrotehniko, računalništvo in informatiko. Pridobljeno 4. 6. 2014 s spletne strani: http://dkum.uni-mb.si/IzpisGradiva.php?id=20570.
Robertson, S., Zaragoza, H. in Taylor, M. (2004). Simple BM25 extension to multiple weighted fields. V Proceedings of the thirteenth ACM international conference on Information and knowledge management. New York: ACM, 42–49.
Su, X. in Khoshgoftaar, T. M. (2009). A survey of collaborative filtering techniques. Advances in artificial intelligence, Article ID 421425, 19 strani. Pridobljeno 4. 6. 2014 s spletne strani: http://dx.doi.org/10.1155/2009/421425.
Mobilne aplikacije
Mobilne aplikacije za iskanje po nacionalni infrastrukturi odprtega dostopa delujejo na operacijskih sistemih Windows Phone, Android in iOS.