- 78 - [in:] M. Górnicz, M. Kornacka (eds.) Języki Specjalistyczne 9. Wyraz – tekst – interpretacja, Warszawa: Katedra Języków Specjalistycznych, Uniwersytet Warszawski, s. 78-97. Marek Łukasik ANOTACJA KORPUSÓW TEKSTÓW SPECJALISTYCZNYCH 1. Rozwój technik komputerowych przyniósł istotną zmianę jakościową w badaniach językoznawczych i doprowadził do narodzin nowej dziedziny – lingwistyki komputerowej/informatycznej (ang. computational linguistics). Komputery i dedykowane oprogramowanie nie tylko wzbogaciły warsztat badawczy lingwistyki, ale również przyczyniły się do powstania zupełnie nowych form działalności badawczej , znajdujących się na styku lingwistyki i informatyki, takich jak tłumaczenie maszynowe (ang. machine translation), automatyczne sporządzanie indeksów (ang. automatic indexing), czy automatyczna ekscerpcja terminów (ang. automatic acquisition of terms). Wspólną cechą powyższych dyscyplin jest wykorzystanie na pewnym etapie korpusów tekstowych, niejedno- krotnie anotowanych. Nie jest to jednak obszar zarezerwowany wyłącznie dla specjalistów z dziedziny informatyki zajmujących się przetwarzaniem języka naturalnego: anotowane korpusy tekstowe mogą z powodzeniem stać się przydat- nym narzędziem w warsztacie terminologa, terminografa czy tłumacza tekstów specjalistycznych. Poniżej przedstawiłem zarys problematyki anotacji (wzbogacania) korpu- sów tekstowych. Artykuł otwierają ogólne rozważania związane z anotacją korpusów. Na kolejnych stronach zostają one zilustrowane anotacją przykładowe- go tekstu specjalistycznego. Drugą część pracy stanowi studium przypadku, w którym przedstawiłem możliwości wykorzystania anotowanego korpusu tekstów specjalistycznych do ekscerpcji terminów. 2. „Korpus tekstowy to każdy zbiór pisanych lub mówionych tekstów sformułowanych w określonym języku (językach), które zostały zebrane i wybrane według określonych kryteriów” [Grucza 2007: 108] . Stosowanie pewnych parametrów doboru materiału językowego świadczy o tym, że korpusy tekstowe powstają z myślą o konkretnym celu badawczym bądź pragmatycznym. Korpus zatem, w rozumieniu współczesnej lingwistyki, nie jest przypadkowym zbiorem tekstów, na przykład zgromadzonym w bibliotece [Grucza 2007: 110; Hunston 2002: 2; Waliński 2005]. Ponadto w literaturze przedmiotu podkreśla się, że obecnie