A data-intensive view on the emerging Estonian written language community, 1800–1940
National bibliography, data enrichment, and public schools
Keywords: national bibliography, data-intensive humanities, Estonian national awakening, written language, book history
The Estonian National Bibliography aims to provide a comprehensive overview of all printed works published in Estonia, by Estonians, or about Estonians. Bibliographic data science has suggested that national bibliographies can be used to study cultural history using the tools of digital humanities. In this article, I explore the historical details surrounding the emergence of the Estonian written language community, with a focus on the mid- to late 19th century.
I introduce the Estonian National Bibliography as a data source and trace the emergence of the Estonian written language community within its records. Specifically, I look at changes in the status of the Estonian language within its language area, the backgrounds of the contributors to book publishing, and the possible influence of public schools. I enrich these analyses by incorporating other biographical, demographic, geographic, and historical datasets.
Over time, books published in the Estonian language area began to rely more on Estonian, building on an earlier German-language tradition. Despite the early importance of multilingual contributors, the main contributors soon began working mostly in Estonian. From the early 19th century through the National Awakening, the average age of new contributors decreased by around 10 years, reflecting the steady influx of younger educated people.
The analysis of the contributors’ birth backgrounds reveals that dialectal diversity among community members gradually increased, with some local variation. For a few decades around the time of the National Awakening, being born in the Governorate of Livonia doubled one’s chances of joining the written language community. This can be partly explained by differences in educational policy that led the Governorate of Estonia to fall behind in expanding its public school network.
This article demonstrates how national bibliographic data can be used to study cultural history. Combining it with other data sources enables researchers to address questions from different disciplines – for example, assessing the impact of historical education policies or investigating shifts in dialectal diversity within a language community.
Peeter Tinits (b. 1986), PhD, University of Tartu, Institute of Estonian and General Linguistics / Max Planck Institute for Evolutionary Anthropology (Deutscher Platz 6, 04103 Leipzig, Germany), research fellow in digital humanities, peeter.tinits@ut.ee
Kirjandus
KOOD JA ANDMED
Artikli tehniline lisa, analüüsi kood ja andmed: https://doi.org/10.17605/OSF.IO/KJZ4S
VEEBIVARAD
Deutsche Nationalbibliografie. https://www.dnb.de/EN/Professionell/Metadaten-dienste/Metadaten/Nationalbibliografie/nationalbibliografie_node.html
ERB = Eesti rahvusbibliograafia (raamatud). https://digilab.rara.ee/andmestikud/raamatud/
GeoNames kohanimeandmebaas. https://www.geonames.org
ISIK = Eesti biograafiline andmebaas ISIK. http://www2.kirmus.ee/biblioserver/isik
KNAB = Eesti Keele Instituudi kohanimeandmebaas. https://arhiiv.eki.ee/knab/knab.htm
VEPER = Väliseesti isikulooline andmebaas. https://veper.tlulib.ee/
VIAF = Virtual International Authority File. https://viaf.org
Wikidata database. https://www.wikidata.org
KIRJANDUS
Ainsaar, Mare 1997. Eesti rahvastik Taani hindamisraamatust tänapäevani. Estonian population from Liber Census Daniae up to nowadays. Tartu: Tartu Ülikooli Kirjastus.
Anderson, Benedict 1991. Imagined Communities: Reflections on the Origin and Spread of Nationalism. London: Verso.
Andresen, Lembit 1985. Eesti rahvakooli vanem ajalugu. Tallinn: Valgus.
Andresen, Lembit 1999. Eesti rahvakooli ja pedagoogika ajalugu. II, Kaheksateistkümnes sajand. Tallinn: Avita.
Andresen, Lembit 2002. Eesti rahvakooli ja pedagoogika ajalugu. III, Koolireformid ja venestamine (1803–1918). Tallinn: Avita.
Andresoo, Janne 2000. Eesti rahvusbibliograafia – uue aastatuhande väljakutsed. – Tartu Ülikooli Raamatukogu aastaraamat 5. Toim Rein Saukas. Tartu: Tartu Ülikooli Kirjastus, lk 140–143.
Antik, Richard 1932. Eesti Rahva Muuseumi Arhiivraamatukogu. 1632.–1917. a. ilmunud eestikeelsete raamatute nimestik. Tartu: Eesti Rahva Muuseumi Arhiivraamatukogu.
Barron, Alexander T. J.; Huang, Jenny; Spang, Rebecca L.; DeDeo, Simon 2018. Individuals, institutions, and innovation in the debates of the French Revolution. – Proceedings of the National Academy of Sciences, kd 115, nr 18, lk 4607–4612. https://doi.org/10.1073/pnas.1717729115
Buringh, Eltjo; Van Zanden, Jan L. 2009. Charting the „Rise of the West”: Manuscripts and printed books in Europe, a long-term perspective from the sixth through eighteenth centuries. – The Journal of Economic History, kd 69, nr 2, lk 409–445. https://doi.org/10.1017/S0022050709000837
Eesti rahvusraamatukogu 2023a. Estonian National Bibliography – books in Estonian [Data set]. – Zenodo. https://doi.org/10.5281/zenodo.8228805
Eesti rahvusraamatukogu 2023b. Estonian National Bibliography – foreign language books [Data set]. – Zenodo. https://doi.org/10.5281/zenodo.8228821
Hennoste, Tiit 1997. Eesti keele sotsioperioodid. Üldpilt. – Pühendusteos Huno Rätsepale 28.12.1997. (Tartu Ülikooli eesti keele õppetooli toimetised 7.) Toim Mati Erelt, Meeli Sedrik, Ellen Uuspõld. Tartu: Tartu Ülikooli Kirjastus, lk 44–66.
Hennoste, Tiit; Pajusalu, Karl 2020. Murded ja kirjakeel. – Eesti murded ja kohanimed. 3., kohendatud ja täiendatud trükk. Toim K. Pajusalu, T. Hennoste, Ellen Niit, Peeter Päll, Jüri Viikberg. Tallinn: Emakeele Selts, lk 67−76.
Ibrus, Indrek; Schich, Maximilian; Tamm, Marek 2021. Digihumanitaariast kultuuriandmete analüüsini. – Keel ja Kirjandus, nr 8–9, lk 671–688. https://doi.org/10.54013/kk764a2
Jordan, Paul Eduard 1886. Die Resultate der ehstländischen Volkszählung vom 29. December 1881 in textlicher Beleuchtung. Tallinn: Lindfors’ Erben.
Jürgenson, Dietrich Heinrich 1844. Kurze Geschichte der ehstnischen Literatur. Aus dem Nachlasse des Seminarinspektors Jürgenson. Tartu: F. Severin.
Kandler, Anne; Powell, Adam 2018. Generative inference for cultural evolution. – Philosophical Transactions of the Royal Society B: Biological Sciences, kd 373, nr 1743, 20170056. https://doi.org/10.1098/rstb.2017.0056
Karjahärm, Toomas 2012. Vene impeerium ja rahvuslus. Moderniseerimise strateegiad. Tallinn: Argo.
Karjahärm, Toomas; Sirk, Väino 1997. Eesti haritlaskonna kujunemine ja ideed 1850–1917. Tallinn: Eesti Entsüklopeediakirjastus.
Karsdorp, Folgert; McGillivray, Barbara; Nerghes, Adina; Wevers, Melvin 2020. Preface. – Proceedings of the Workshop on Computational Humanities Research (CHR 2020). (CEUR Workshop Proceedings 2723.) Toim F. Karsdorp, B. McGillivray, A. Nerghes, M. Wevers. Aachen: CEUR-WS, lk v–viii.
Kask, Arnold 1984. Eesti murded ja kirjakeel. – Emakeele Seltsi toimetised 16. Tallinn: Valgus.
Kestemont, Mike; Karsdorp, Folgert; de Bruijn, Elisabeth; Driscoll, Matthew; Kapitan, Katarzyna A.; Ó Macháin, Pádraig; Sawyer, Daniel; Sleiderink, Remco; Chao, Anne 2022. Forgotten books: The application of unseen species models to the survival of culture. – Science, kd 375, nr 6582, lk 765–769. https://doi.org/10.1126/science.abl7655
Kikas, Katre 2018. Meenutatud keel ja unustatud kiri: rahvalikud keelekorraldajad J. Hurda rahvaluulekogus. – Mäetagused, nr 70, lk 13–38. https://doi.org/10.7592/MT2018.70.kikas
Kruus, Oskar 1995. Eesti kirjarahva leksikon. Tallinn: Eesti Raamat.
Kruusmaa, Krister; Tinits, Peeter; Nemvalts, Laura 2025. Curated Bibliographic Data: The case of the Estonian National Bibliography. – Journal of Open Humanities Data, kd 11, nr 1. https://doi.org/10.5334/johd.280
Laar, Mart 2005. Äratajad: rahvuslik ärkamisaeg Eestis 19. sajandil ja selle kandjad. Tartu: Greif.
Lahti, Leo; Marjanen, Jani; Roivainen, Hege; Tolonen, Mikko 2019a. Bibliographic data science and the history of the book (c. 1500–1800). – Cataloging & Classification Quarterly, kd 57, nr 1, lk 5–23. https://doi.org/10.1080/01639374.2018.1543747
Lahti, Leo; Vaara, Ville; Marjanen, Jani; Tolonen, Mikko 2019b. Best practices in bibliographic data science. – Proceedings of the Research Data and Humanities (RDHUM) 2019 Conference: Data, Methods and Tools. (Studia humaniora ouluensia 17.) Toim Jarmo Harri Jantunen, Sisko Brunni, Niina Kunnas, Santeri Palviainen, Katja Västi. Oulu: University of Oulu, lk 57–65.
Lukas, Liina 2008. Balti kirjakultuuri mitmekeelsest loomust. − Rahvuskultuur ja tema teised. (Collegium litterarum 22.) Toim Rein Undusk. Tallinn: Underi ja Tuglase Kirjanduskeskus, lk 23−33.
Lõuna, Kalle 2003. Petserimaa integreerimine Eesti Vabariiki 1920–1940. (Loodus, aeg, inimene.) Tallinn: Eesti Entsüklopeediakirjastus.
Marjanen, Jani; Vaara, Ville; Kanner, Antti; Roivainen, Hege; Mäkelä, Eetu; Lahti, Leo; Tolonen, Mikko 2019. A national public sphere? Analyzing the language, location, and form of newspapers in Finland, 1771–1917. – Journal of European Periodical Studies, kd 4, nr 1, lk 54–77. https://doi.org/10.21825/jeps.v4i1.10483
Matjus, Ülo 1999. Tallamisi rahvusbibliograafia radadel. – Akadeemia, nr 4, lk 832–849.
Michelson, Ruth 2002. Estica/Estonica/Baltica määratlemisest. – Tartu Ülikooli Raamatukogu aastaraamat 7. Toim Rein Saukas. Tartu: Tartu Ülikooli Kirjastus, lk 162–172.
Miks, A. 1938. Märkusi eesti kultuuritegelaste päritolu kohta. – Eesti Kirjandus, nr 3, lk 129–141.
Mägi, Arvo 1942. Eesti juhtkonna päritolust. – Postimees 5. XII, lk 6.
Paatsi, Vello 2001. Seal kirjutab nüüd juba karjapoiss… Eesti rahvakooli muutumisi 1840–1886. I. – Akadeemia, nr 5, lk 875–903.
Paatsi, Vello 2002. Kooliõpetajal on kooskäimisi niisama tarwis nagu kristlasel kirikus-käimist. Eesti rahvakooli muutumisi 1840–1886. II. – Akadeemia, nr 1, lk 93−121.
Paatsi, Vello 2016. Rännates Gutenbergi galaktikas. Kultuuriloolisi uurimusi aastatest 1993–2015. (Ilmatargad.) Tartu: Ilmamaa.
Plado, Helen 2022. Rahvakeelsus XX sajandi alguskümnendite Eesti keelekorralduses (Vaateid eesti keelekorralduse arenguloole). – Keel ja Kirjandus, nr 12, lk 1075–1092. https://doi.org/10.54013/kk780a1
Pullat, Raimo 2004. Lootuste linn Peterburi ja eesti haritlaskonna kujunemine kuni 1917. aastani. Tallinn: Estopol.
Raag, Raimo 2008. Talurahva keelest riigikeeleks. Tartu: Atlex.
Raun, Toivo U. 2017. Literacy in the Russian empire in the late 19th century: the striking case of the Baltic provinces. – Acta Historica Tallinnensia, nr 23, lk 65–77. http://doi.org/10.3176/hist.2017.1.06
Reimo, Tiiu; Paatsi, Vello 2010. Eesti ja baltisaksa trükisõna aastail 1801–1917. Uurimisseis ja perspektiivid. – Trükis Eesti- ja Liivimaal 1801–1917. Toim V. Paatsi. Tartu: Eesti Kirjandusmuuseum, lk 7−19.
Risberg, Lydia; Langemets, Margit 2023. Sõnatähenduste normimise traditsioon ja selle murdmine eesti keelekorralduses. – Eesti ja soome-ugri keeleteaduse ajakiri. Journal of Estonian and Finno-Ugric Linguistics, kd 14, nr 1, lk 49–80. https://doi.org/10.12697/jeful.2023.14.1.02
Rosenplänter, Johann Heinrich 1832. Uebersicht der esthnischen Literatur, nach dem Inhalte der Schriften und chronologisch geordnet. – Beiträge zur genauern Kenntniβ der esthnischen Sprache, kd 20. Pärnu: Rosenplänter, lk 1–41.
Schich, Maximilian; Song, Chaoming; Ahn, Yong-Yeol; Mirsky, Alexander; Martino, Mauro; Barabási, Albert-László; Helbing, Dirk 2014. A network framework of cultural history. – Science, kd 345, nr 6196, lk 558−562. https://doi.org/10.1126/science.1240064
Sakova-Merivee, Aija 2014. Eesti retrospektiivne rahvusbibliograafia – kellele ja miks? – Keel ja Kirjandus, nr 11, lk 862–866. https://doi.org/10.54013/kk684a5
Talve, Ilmar 2004. Eesti kultuurilugu. Keskaja algusest Eesti iseseisvuseni. Tartu: Ilmamaa.
Tinits, Peeter 2023. Stratified historical corpus of Estonian 1800–1940. – Eesti Rakenduslingvistika Ühingu aastaraamat, kd 19, lk 175–194. http://doi.org/10.5128/ERYa19.11
Tinits, Peeter; Klavan, Jane; Lindström, Liina 2021. Digihumanitaaria Eestis. – Keel ja Kirjandus, nr 8–9, lk 667−677. http://doi.org/10.54013/kk764a1
Tolonen, Mikko; Hill, Mark J.; Ijaz, Ali Zeeshan; Vaara, Ville; Lahti, Leo 2021. Examining the early modern canon: The English Short Title Catalogue and large-scale patterns of cultural production. – Data Visualization in Enlightenment Literature and Culture. Toim Ileana Baird. Cham: Palgrave Macmillan, lk 63–119. https://doi.org/10.1007/978-3-030-54913-8_3
Tolonen, Mikko; Mäkelä, Eetu; Lahti, Leo 2022. The anatomy of Eighteenth Century Collections Online (ECCO). – Eighteenth-Century Studies, kd 56, nr 1, lk 95–123. https://doi.org/10.1353/ecs.2022.0060
Uiboaed, Kristel; Kyröläinen, Aki 2015. Keeleteaduslike andmete ruumilisi visualiseerimisvõimalusi. – Eesti Rakenduslingvistika Ühingu aastaraamat, kd 11, lk 281–295. http://doi.org/10.5128/ERYa11.17
Underwood, Ted 2019. Distant Horizons: Digital Evidence and Literary Change. Chicago: University of Chicago Press.
Undusk, Jaan 2011. Baltisaksa kirjakultuuri struktuurist. Ärgituseks erinumbri lugejale. – Keel ja Kirjandus, nr 8–9, lk 561−671.
Undusk, Jaan 2012. Luterlik, valgustuslik ja romantiline keeleideoloogia meie vanemas kirjakultuuris. – Vikerkaar, nr 10–11, lk 73–90.
Vinkel, Aarne 1966. Eesti rahvaraamat. Ülevaade XVIII ja XIX sajandi lugemisvarast. Tallinn: Eesti Raamat.