Preskoči na vsebino

Viri in orodja

Korpus Kranjska 1.0

Korpus Kranjska 1.0 vključuje stenografske zapisnike zasedanj kranjskega deželnega zbora (Obravnave deželnega zbora kranjskega / Bericht über die Verhandlungen des krainischen Landtages) od leta 1861 do 1913, skupaj 11 sklicev. Nastal je na osnovi dokumentov PDF, pripravljenih s skeniranjem in optično prepoznavo (OCR) tiskanih zapisnikov ter objavljenih v Digitalni knjižnici Slovenije dLib.si in na portalu SIstory. Korpus sestavljajo faksimili zapisnikov v formatu PDF in pripadajoči stojno berljivi dokumenti XML v formatu Parla-CLARIN TEI z označenimi metapodatki, vključno z oblikoskladenjskim označevanjem in lematizacijo. Korpus obsega 694 zapisnikov zasedanj (skupaj 15.353 strani) in parlamentarne govore z več kot 10 milijonov besed. Zapisniki so večinoma dvojezični, jezik posameznega govora pa je odvisen od govorca: približno 58 % povedi je v slovenščini in 42 % v nemščini. Nemško besedilo je bilo sprva zapisano v gotici, v kasnejših zapisnikih pa v latinici. Korpus je na voljo v repozitoriju CLARIN.SI s povezavo na konkordančnika noSketch Engine in KonText ter v spletni aplikaciji ParlaVis.