O platformă digitală inteligentă care oferă acces structurat la colecții academice de referință ale patrimoniului literar românesc — construită de la exporturi brute InDesign la descoperire alimentată de Elasticsearch pe multiple corpusuri.
Lucrările de referință academică din studiile literare românești existau doar ca publicații tipărite și fișiere InDesign — fără acces digital unificat, fără flux editorial, fără modalitate de căutare sau actualizare colaborativă. Conținut bogat inclusiv text formatat, imagini și bibliografii necesita conservare.
Un pipeline complet de date: scrapare exporturi HTML InDesign, extragere câmpuri semantice via mapare clase CSS, serializare în JSONL, indexare în masă în Elasticsearch și servire printr-un backend FastAPI cu frontend React admin — suportând editare colaborativă, jurnal de audit și căutare multi-corpus.
Scraper BeautifulSoup4 mapează clase CSS la câmpuri semantice, reconstruiește text ierarhic din HTML plat și extrage referințe imagini.
Căutare full-text Elasticsearch în peste 5 corpusuri (ELIV, CLRV, HLRV, TLVR, DCLR) cu gestionare diacritice românești și navigare alfabetică.
CKEditor5 și React-Quill pentru editare colaborativă a intrărilor academice cu gestionare imagini, legende și păstrarea formatării.
Navigare bazată pe cronologie pentru corpusuri istorice (DCLR), navigare alfabetică A-Z inclusiv litere specifice românești (Ă, Â, Î, Ș, Ț).
Traseu complet de audit al tuturor modificărilor — cine a schimbat ce, când, de la ce IP — menținând integritatea academică în fluxurile colaborative.
Interfață în română și engleză cu permisiuni bazate pe roluri asigurând că doar cercetătorii autorizați pot edita intrările.
Hai să construim următoarea ta platformă împreună.
Contactează-ne→Vezi Mai Multe Proiecte