POSVET | Plagiatorstvo in pristopi k detekciji podobnih vsebin

V zadnjih letih so slovenski mediji razkrili več afer, katerih vzrok je bilo plagiatorstvo. Med tistimi, ki so prepisali svoje zaključne naloge, brez da bi ustrezno navajali vire, iz katerih so črpali, so bili poslanci, ministri, direktorji, uslužbenci v javni upravi, zaposleni na univerzah in še mnogi drugi, ki so jih odkrile akademske inštitucije same. Plagiatorstvo se ne pojavlja samo v akademskih krogih pač pa je razširjeno tudi v gospodarstvu, v javni upravi in tudi na drugih področjih. Namen posveta je predstaviti kaj je to plagiatorstvo, kako ga preprečimo ter kako delujejo programi za detekcijo podobnih vsebin. Na primerih prepisanih besedil bomo pokazali kako deluje program za detekcijo podobnih vsebin, katerega uporabljajo slovenske izobraževalne inštitucije in je bil razvit v Laboratoriju za heterogene računalniške sisteme na Inštitutu za računalništvo, fakultete za elektrotehniko, računalništvo in informatiko.

Kdaj: 20.02.2019 ob 10. uri

Lokacija: Univerza v Mariboru, Fakulteta za elektrotehniko, računalništvo in informatiko, Koroška cesta 46, Maribor

Prostor: G2 - Alfa

Program posveta

10.10 – 10.15 Uvod in namen posveta

10.15-10.45 Milan Ojsteršek: Kaj je plagiatorstvo in kako ga preprečimo?
V predavanju bo predstavljen pojem plagiatorstva, kakšne vrste plagiatov poznamo in kako nam lahko pri odkrivanju podobnih vsebin pomagajo računalniški programi. Na praktičnih primerih bomo prikazali najpogostejše vrste plagiatov. Na kratko bomo opisali tudi kako delujejo programi za preverjanje podobnih vsebin. Podrobnejše predstavitve posameznih metod, ki jih uporablja detektor podobnih vsebin, ki je bil razvit v Laboratoriju za heterogene računalniške sisteme, pa bodo podane v naslednjih predavanjih. Na koncu predavanja bomo predstavili analizo podobnosti dokumentov iz testnega korpusa dokumentov, ki so bili objavljeni v repozirorijih nacionalne infrastructure odprtega dostopa po letu 2000.

10:45 – 11.10: Sandi Majninger: Ugotavljanje pomena v besedilih. 
V predavanju bo na kratko predstavljeno področje obdelave naravnega jezika v besedilih. Predstavljeni bodo rezultati primerjave orodij za oblikoslovno označevanje in skladenjsko razčlenjevanje besedil v slovenskem jeziku. Nato bodo predstavljeni postopki za odkrivanje pomena iz besedila. Poudarek bo na pomenski analizi in tvorbi ontologij iz besedila. Drugi del predavanja bo posvečen uporabi teh postopkov za odkrivanje podobnih delov besedila. Najprej bo predstavljen pristop, ki besedila primerja s pomočjo pomenskih podpisov in pomenskega stiskanja. Na koncu bo predstavljena ideja, kako bi lahko pomensko analizo besedila in ontologije uporabili za iskanje podobnih delov besedil.

11:10 – 11.35: Goran Hrovat: Algoritmi za odkrivanje podobnih vsebin.
Kaj vse moramo narediti, da za obravnavan dokument odkrijemo podobne dele besedila z drugimi dokumenti? Predstavljen bo algoritem odkrivanja podobnih dokumentov iz večmilijonske množice dokumentov. Cilj algoritma je v logaritemskem času odkriti kandidate in nato izvesti izčrpno primerjavo med njimi in obravnavanim dokumentom. Predstavljen bo algoritem, ki lahko paralelno primerja kandidate z obravnavanim dokumentom, rezultate različnih primerjav pa nato združi.

11.35- 12.00: Mladen Borovič: Hibridni priporočilni sistemi.
V predavanju bo na kratko predstavljeno področje priporočilnih sistemov s fokusom na hibridne priporočilne sisteme, ki v zadnjem času prednjačijo tako v raziskovalnem okolju kot tudi v praksi. Podrobneje bodo predstavljeni različni tipi hibridizacije priporočilnih sistemov. V drugem delu predavanja bo predstavljen hibridni priporočilni sistem, ki od leta 2013 deluje v nacionalni infrastrukturi odprtega dostopa. Na koncu bodo na kratko predstavljeni tudi drugi priporočilni sistemi, ki jih lahko znotraj digitalnih knjižnic uporabljamo za priporočanje mentorjev, polavtomatsko dodeljevanje vrstilcev UDK novim gradivom in kot filter pri izboru dokumentov kandidatov pri detekciji podobnih vsebin.

Mediji o dogodku