Medievisté z FF UK školili práci s umělou inteligencí při analýze rukopisů a vystoupili na konferenci v Princetonu 

Foto: ÚČJTK

Filozofickou fakultu UK na obou akcích zastupovali Anna Michalcová, doktorandka Ústavu českého jazyka a teorie komunikace FF UK, a Martin Roček, doktorand Ústavu řeckých a latinských studií FF UK. Společně s Janem Odstrčilíkem (Institut für Mittelalterforschung, Österreichische Akademie der Wissenschaften) vedli na workshopu výuku zaměřenou na pokročilou práci s nástrojem Transkribus. Výuku doplnila Christine Roughan (Princeton University), která představila možnosti využití platformy eScriptorium. Intenzivního třídenního kurzu se zúčastnili badatelé z různých oblastí historických věd, přičemž kurz jim poskytl úvod do práce s nástroji pro automatické rozpoznávání historického písma (ATR – Automated Text Recognition / HTR – Handwritten Text Recognition). 

Konference SCOOP: Source Codes of the Past představovala první kroky k vytvoření mezinárodní sítě propojující odborníky na středověké texty a rukopisy s vývojáři technologií strojového učení. Hlavními organizátory byly Institute for Advanced Study (IAS), Princeton; Center for Digital Humanities (CDH), Princeton University; Manuscripts, Rare Books, and Archival Studies (MARBAS), Princeton University; Humanities Initiative, Princeton University; a Digital Lab, Institute for Medieval Research (IMAFO), Austrian Academy of Sciences. Akce byla dále sponzorována institucemi Center for Collaborative History, Department of Classics; Seeger Center for Hellenic Studies (s podporou Stanley J. Seeger Hellenic Fund); Program in Medieval Studies; a Committee for the Study of Late Antiquity při Princeton University. Obě akce vznikly z iniciativy prof. Helmuta Reimitze, medievisty z Princeton University. 

Na konferenci vystoupili čeští účastníci, kteří se zároveň podíleli i na její přípravě: Anna Michalcová s příspěvkem o pravopisné variabilitě jako výzvě pro HTR v českých středověkých rukopisech (Orthographic Variability as HTR Challenge: Insights from Medieval Czech Manuscripts), Jan Odstrčilík s analýzou rozdílných transkripčních konvencí u latinsko-českých kázání (Different Transcription Conventions for Various Languages in ATR: The Case of Latin-Czech Medieval Sermons) a Martin Roček s prezentací využití modelu S-BERT pro sémantické vyhledávání podobných vět (Enhancing Sentence Similarity Search with S-BERT: A Semantic Approach)

Obě akce položily první stavební kámen ke vzniku mezinárodní výzkumné platformy, která propojuje práci s historickými prameny, filologii a technologie strojového učení. Vytvořená síť otevírá prostor pro dlouhodobou spolupráci, sdílení nástrojů i dat a zároveň motivuje ke vstupu další zájemce z českého akademického prostředí. Na společně navázané partnerství naváže mezinárodní konference věnovaná technologiím HTR/ATR ve výzkumu historických pramenů, která se uskuteční v roce 2026 na Vídeňské univerzitě a bude organizována Ústavem pro výzkum středověku Rakouské akademie věd (Institut für Mittelalterforschung, Österreichische Akademie der Wissenschaften) ve spolupráci s Vídeňskou univerzitou (Universität Wien), přičemž mezi členy organizátorského týmu budou i čeští medievisté, kteří se podíleli na princetonských setkáních. 


Související články