კორპუსლინგვისტიკის კვლევის ობიექტი

კორპუსლინგვისტიკა, ტრადიციული ლინგვისტიკის მსგავსად, ენობრივ ფაქტებს იკვლევს, ოღონდ მისგან განსხვავებით ა) დიდი მოცულობის ციფრულ მონაცემთა ბაზებს (Big Data) ეყრდნობა და ბ) კვლევის პროცესში თანამედროვე ტექნოლოგიებს იყენებს.

ლინგვისტიკასა და კორპუსლინგვისტიკას შორის განსხვავება, ერთი შეხედვით, მხოლოდ მონაცემთა სიდიდესა და მეთოდური დამუშავების  ტექნოლოგიზებაში (ანუ მონაცემთა ელექტრონული დამუშავების შესაძლებლობაში) მდგომარეობს. მაგრამ თუ საკითხს კორპუსლინგვისტიკის საგანთან მიმართებაში ჩავუღრმავდებით, ადვილად აღმოვაჩენთ არსებით განსხვავებას ტრადიციულ ლინგვისტიკასა და კორპუსლინგვისტიკას შორის.

რა არის ტრადიციული ლინგვისტიკის კვლევის ობიექტი?

• ტრადიციული ლინგვისტიკა იკვლევს ენას მისი „სწორი“ ფორმების (ანუ ნორმების) დადგენისა და შესაბამისად, ამ ენის გრამატიკის შექმნის მიზნით. მისი კვლევის რესურსს ძირითადად წარმოადგენს წერილობითი წყაროები.

რა არის კორპუსლინგვისტიკის კვლევის ობიექტი?

• კორპუსლინგვისტიკის კვლევის ობიექტი არის ენა, ოღონდ ენა არა როგორც ნიშანთა აბსტრაქტული სისტემა, არამედ როგორც ენობრივი ნიშნების გამოვლენის შესაძლებლობების ჯამი. მისი კვლევის  რესურსს წარმოადგენს ენის მოხმარების ყველა კონტექსტი – როგორც წერილობითი, ისე ზეპირმეტყველების წყაროები.

კორპუსლინგვისტიკისათვის მნიშვნელოვანია არა მხოლოდ სალიტერატურო, ნორმირებული ენის ფაქტები, არამედ მისი გეოგრაფიული და სოციალური ინვარიანტების  (დიალექტებისა და  სოციოლექტების) ფართო რეგისტრიც. ანუ ის ენობრივი რესურსები, რომელსაც ეყრდნობა კორპუსლინგვისტიკა, შეიცავს ენის ფუნქციონირების ყველა ბუნებრივ შემთხვევას. შესაბამისად, კორპუსლინგვისტიკაში კვლევა ემყარება და ითვალისწინებს როგორც ნორმირებულ (წერილობით), ისე „არანორმირებულ“ (ზეპირმეტყველების ნიმუშები) ენობრივ ფაქტებს. ანუ კორპუსლინგვისტიკა იკვლევს ენას მის ბუნებრივ მოცემულობაში – დინამიკაში.

სახალისო გადახვევა: კორპუსლინგვისტიკა დაინტერესებულია ენის არა მხოლოდ ძირითადი რეგისტრებით, როგორიცაა მეტყველების რესურსები სოციალური, გენდერული, ასაკობრივი ჯგუფების გათვალისწინებით, არამედ აინტერესებს და იკვლევს ადამიანის მეტყველებას სხვადასხვა ფიზიკურ-ფსიქოლოგიურ მდგომარეობაშიც, მაგ. ალკოჰოლის ზემოქმედების ქვეშ მყოფი პირების მეტყველება, რათა მოხდეს მეტყველების ამ ფორმის სისტემური ჩართვა კორპუსში ავტომატური ანალიზის სფულფასოვანი განხორციელებისათვის. მაგ., მეტყველების ავტომატური ამოცნობის პროგრამას  უნდა შეეძლოს ნასვამი ადამიანის მეტყველების აკუსტიკური „აღქმა“ და მისი „გადაწერა“ სმარტი ტექნოლოგიების პირობებში და შესაბამისი რეაგირება მასზე. ასევე დიდი ყურადღება ექცევა დეფექტური მეტყველების შესწავლას და მის კომპიუტერულ დამუშავებას.

აქედან გამომდინარე, კორპუსლინგვისტიკის საკვლევი ბაზა – ტექსტური კორპუსები – ისე უნდა იყოს აგებული, რომ ასახავდეს ენის რეალიზების რაც შეიძლება ფართო სპექტრს (იხ. ნოა ბუბენჰოფერის ნაშრომი ენის გამოყენების ნიმუშებისა და შემთხვევების შესახებ. Noah Bubenhofer, Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin, New York: de Gruyter, 2009). ანუ, ტექსტური კორპუსი არა მარტო რეპრეზენტატიულობით უნდა ხასიათდებოდეს, არამედ უნდა ასახავდეს ენის რეალიზების ჟანრულ მრავალფეროვნებასაც – ტექსტის განსხვავებულ სახეებს.

ამდენად, კორპუსლინგვისტიკა ენას განიხილავს არა მხოლოდ როგორც აბსტრაქტულად არსებულ ნიშანთა სისტემას (ფერდინანდ დე სოსიურის მიხედვით „Langue“, ან ნოამ ჩომსკის მიხედვით „Competence“), არამედ როგორც ენის გამოვლენის ნებისმიერ ფორმათა ერთობლიობასაც (ფერდინანდ დე სოსიურის მიხედვით „Parole“, ან ნოამ ჩომსკის მიხედვით „Performance“).

ზემოთქმულიდან გამომდინარე, კორპუსლინგვისტიკის მიზანია ენის რეალიზების ნებისმიერი ემპირიული ფაქტის კვლევა და ენათმეცნიერებაში გავრცელებული დიქოტომიის Langue“ – „Parole-ის მოხსნა. შესაბამისად, მისი კვლევის ობიექტს წარმოადგენს არა მხოლოდ დაგეგმილი, არამედ დაუგეგმავი ენის ფაქტებიც. 

ps
დასკვნის სახით შეგვიძლია ვთქვათ, რომ, არსებითი განსხვავება ლინგვისტიკასა და კორპუსლინგვისტიკას შორის ენის, როგორც ფენომენის, გაგებაში უნდა ვეძებოთ.