Factors Differentiating the Statements of Narrators: A Stylometric Analysis of Biographical Interviews Cover Image

Czynniki różnicujące wypowiedzi informatorów – analiza stylometryczna wywiadów biograficznych
Factors Differentiating the Statements of Narrators: A Stylometric Analysis of Biographical Interviews

Author(s): Magdalena Kądzioła
Subject(s): History, Oral history
Published by: Ośrodek »Pamięć i Przyszłość«
Keywords: biographical accounts; stylometry; spoken language; classification of texts; metadata

Summary/Abstract: W artykule zostają zaproponowane sposoby analizy treści i metadanych wywiadów biograficznych metodami statystycznymi. Podstawą do przeprowadzenia serii eksperymentów stylometrycznych był specjalnie stworzony korpus o rozmiarze przekraczającym 1,2 mln jednostek leksykalnych. Na korpus złożyły się teksty wybranych relacji biograficznych pochodzących z Archiwum Historii Mówionej, Domu Spotkań z Historią i Ośrodka KARTA, udostępnianych na portalu: www.relacjebiograficzne.pl. W badaniach wykorzystano treści wywiadów biograficznych 41 osób przyporządkowanych do trzech kategorii tematycznych: Warszawa, wieś, ziemiaństwo. Głównym celem eksperymentów było ustalenie, jakie czynniki językowe różnicują mówców i które cechy (płeć, miejsce pochodzenia, wiek, długość wypowiedzi, temat) mogą mieć wpływ na klasyfikację. Badania przeprowadzono metodami językoznawstwa kwantytatywnego, a uzyskane wnioski pozwalają na wyznaczenie kierunku dalszych prac w zakresie stylometrii języka mówionego. This article proposes ways to analyse the content and metadata of biographical interviews using statistical methods. The basis for this series of stylometric experiments was a specially created corpus exceeding 1.2 million lexical units in size and composed of texts extracted from selected biographical interviews from the Oral History Archive, the History Meeting House, and the KARTA Centre available on the website www.relacjebiograficzne.pl. Research was based on the content of biographical interviews with forty-one people assigned to three thematic categories: ‘Warsaw,’ ‘the village,’ and ‘gentry.’ The main goal of the experiments was to determine which linguistic factors differentiate speakers and which features (gender, place of origin, age, length of speech, or topic) can influence this classification. This research was carried out using quantitative linguistics methods, and the conclusions we have arrived at allow for the determination of the direction of further work in the field of the stylometry of spoken language.

  • Issue Year: 2018
  • Issue No: 08
  • Page Range: 63-80
  • Page Count: 18
  • Language: Polish