კორპუსლინგვისტიკის მიზანი

კორპუსლინგვისტიკა – დამოუკიდებელი დისციპლინა, კვლევის ახალი ინსტრუმენტი თუ მეთოდი?

ერთ-ერთი ცნობილი პრობლემა, რომელსაც ადგილი აქვს კორპუსლინგვისტიკასთან მიმართებაში, არის იმის განსაზღვრა, თუ რა არის კორპუსლინგვისტიკის კვლევის ობიექტი. ერთი შეხედვით, პასუხი მარტივია: კორპუსლინგვისტიკის კვლევის ობიექტი არის ენა. რით განსხვავდება  მაშინ იგი ტრადიციული ლინგვისტიკისაგან? მხოლოდ იმით, რომ ენობრივი მონაცემების მანქანური დამუშავების ინსტრუმენტები გააჩნია და კვლევის ახალი, ტექნოლოგიური მეთოდებით არის აღჭურვილი?

ზოგადად, სამეცნიერო დისციპლინის არსებობაზე, როგორც წესი, მაშინ საუბრობენ, როდესაც ცალსახად არის გამოკვეთილი კვლევის მიზანი, კვლევის საგანი და კვლევის საკუთარი მეთოდები. ამიტომ, კორპუსლინგვისტიკის არსის დასადგენად, უპირველეს ყოვლისა, სამ კითხვას უნდა გავცეთ პასუხი:

1. რა არის კორპუსლინგვისტიკის მიზანი?

2. რა არის კორპუსლინგვისტიკის კვლევის ობიექტი?

3. გააჩნია თუ არა კორპუსლინგვისტიკას კვლევის საკუთარი მეთოდები?

წინამდებარე ქვეთავში შევეცდებით განვსაზღვროთ კორპუსლინგვისტიკის მიზანი, ანუ მისი, როგორც ინტერდისციპლინური დარგის სამეცნიერო ამოცანები.

კორპუსლინგვისტიკის განსაზღვრება დღეს, გამომდინარე მისი კვლევის ობიექტიდან და მიზნებიდან, არაერთგვაროვანია. თეორიული შრომები კორპუსლინგვისტიკაში, როგორც წესი, პრაქტიკოსი კორპუსლინგვისტების მიერ არის დაწერილი, ამიტომ კორპუსლინგვისტიკის თეორიულ ლიტერატურაში არსებული განსაზღვრებების გვერდით მოვიტანთ კორპუსლინგვისტიკის განსაზღვრებებს იმ ინსტიტუციებისა და სამეცნიერო პროექტების გვერდებიდან, რომლებიც კორპუსების შექმნით არიან დაკავებული:

გერმანული რეფერენციული კორპუსი

კორპუსლინგვისტიკის სამეცნიერო პროგრამა (მიზანი) მდგომარეობს იმაში, რომ დიდი მოცულობის ენობრივ მონაცემთა ბაზების ექსპლორაციული ანალიზის შედეგად მიღებული ცოდნის საფუძველზე ახალი თვალთახედვა შევიმუშაოთ ენის სტრუქტურის, წესების ფუნქციონირებისა და თვისებების შესახებ.

ბერლინის ჰუმბოლდტის უნივერსიტეტის გერმანული ენისა და ენათმეცნიერების ინსტიტუტის ვებგვერდი

კორპუსლინგვისტიკა შეისწავლის (ელექტრონული) კორპუსების აგების, შიდამოწყობის და მისი გამოყენების შესაძლებლობებს. კორპუსები წარმოადგენენ ტექსტების ნაკრებს, რომლებიც მიზანმიმართულად იქმნება იმ ლინგვისტური პრობლემატიკიდან გამომდინარე, რომლის კვლევასაც მიზნად ისახავს კონკრეტული კორპუსი. ჩვენ ვქმნით სპეციალურ კორპუსებს, როგორიცაა სასწავლო კორპუსი ან ისტორიული კორპუსი, და ამით ვქმნით კორპუსის არქიტექტურას.

კომპიუტერული ლინგვისტიკის პორტალი

კორპუსლინგვისტიკა, უპირველეს ყოვლისა, არის მეთოდი, რომელიც საშუალებას გვაძლევს ლინგვისტური პრობლემატიკა დიგიტალურ ტექსტებზე დაყრდნობით ვიკვლიოთ. კვლევის განსახორციელებლად საჭიროა ენის წერილობითი და ზეპირმეტყველების ნიმუშების გაციფრება და მათი ანოტირება მეტყველების ნაწილების მიხედვით. კვლევის ზოგი ასპექტი მოითხოვს დიდი მოცულობის მონაცემების გადამუშავებას, რომელიც უფრო დეტალურ, ამასთან ავტომატურ ანოტაციას საჭიროებს.

შტეფენ ბერმანის სალექციო კურსი კორპუსლინგვისტიკაში (ბოხუმის უნივერსიტეტი)

კორპუსლინგვისტიკა არის მეცნიერების ერთ-ერთი დარგი, რომელიც თავისი მიზნებიდან გამომდინარე, კვლევას ახორციელებს ავთენტურ ენობრივ მასალებზე დაყრდნობით – ანუ კვლევაში იყენებს უკვე არსებულ იმ მონაცემებს, რომლებიც არალინგვისტური მიზნებით არის შექმნილი, მაგ., ბელეტრისტიკა, პუბლიცისტიკა, დარგობრივი ლიტერატურა, პრესა, ზეპირი გამოსვლები, სპონტანური მეტყველება და ა.შ. კორპუსლინგვისტიკა არ იყენებს იმ მონაცემებს, რომლებსაც ლინგვისტები საკუთარი კომპეტენციის (ინტროსპექციის) საფუძველზე ქმნიან ან აგროვებენ ექსპერიმენტებისა და კითხვარების სახით კონკრეტული ენის მატარებლებისაგან, რათა ამ გზით შეამოწმონ საკუთარი თეორიული პოსტულატები.

კორპუსლინგვისტიკის აქ მოტანილი რამდენიმე განსაზღვრებიდანაც  კარგად ჩანს ის სირთულე, რომელიც თავს იჩენს კორპუსლინგვისტიკის დეტერმინაციასთან დაკავშირებით. კორპუსლინგვისტიკის, როგორც ცნების ცალსახა განმარტება, როგორც ასეთი, არ არსებობს. ამიტომ ამ საკითხს აქ აღარ ჩავუღრმავდებით, გვინდა მხოლოდ იმ რამდენიმე ასპექტზე გავამახვილოთ ყურადღება, რომელიც კამათს არ იწვევს:

1. კორპუსლინგვისტიკა ეყრდნობა ავთენტურ ენობრივ რესურსებს;

2. კორპუსლინგვისტიკა კვლევას ახორციელებს გაციფრებულ რესურსებზე დაყრდნობით;

3. კორპუსლინგვისტიკა იყენებს დიდი მოცულობის ემპირიულ მასალას;

4. კორპუსლინგვისტიკის კვლევის საგანია არა მარტო წერილობით დოკუმენტირებული, არამედ ზეპირმეტყველების ენა, ანუ ენის როგორც დაგეგმილი, ისე დაუგეგმავი ვარიანტები;

5. კორპუსების შექმნისა (კორპუსის არქიტექტურა) და მისი მოხმარების ტექნოლოგიზების გარდა კორპუსლინგვისტიკის ამოცანაა ენათმეცნიერებაში ახალი ლინგვისტური თვალთახედვის გახსნა და ინტეგრაციული კვლევის დანერგვა;

ზემოთქმულის გათვალისწინებით, კორპუსლინგვისტიკის მიზანს ასე ჩამოვაყალიბებთ: ორპუსლინგვისტიკის მიზანია ავთენტური ენობრივი მონაცემების გაციფრება და მათი თავმოყრა მონაცემთა სტრუქტურირებულ ბაზებში (ანუ კორპუსების შექმნა),  ენის შესახებ დაგროვილი ცოდნის განახლება-განვრცობა, არსებული თეორიულ-ლინგვისტური პოსტულატების ვერიფიცირება/გენერირება დიდი მოცულობის ტექსტური კორპუსების ბაზაზე, ექსპლორაციული კვლევის შედეგად მიღებული ცოდნის ტექნოლოგიზება – პროგრამული პროდუქტების შექმნა და მათი იმპლემენტაცია როგორც თეორიულ, ისე პრაქტიკულ სამომხმარებლო სფეროში.

ანუ, ტრადიციული ლინგვისტიკისაგან განსხვავებით კორპუსლინგვისტიკის ძირითად მიზანს წარმოადგენს:

• კორპუსის სტრუქტურირების ძირითადი პრინციპების დადგენა და მისი ეფექტური გამოყენების მექანიზმების შექმნა, ანუ კორპუსის ტექნოლოგიური ჩარჩოს გენერირება (კორპუსის შექმნა – Corpus building). ამასთან, ტექნოლოგიური ჩარჩო კორპუსის თემატიკიდან და კვლევის ინტერესებიდან გამომდინარე იქმნება და ერთჯერადია;

• ენობრივი ფაქტების დიგიტალიზაცია და მისი ვირტუალური თავმოყრა კორპუსში (ემპირიული შევსება – input);

• ენობრივი ფაქტებისა და მოვლენების სისტემური კვლევა მისი გამოვლენის ნებისმიერ – წერილობით ან ზეპირმეტყველების – ფორმაში;

• უკვე არსებული ლინგვისტური ცოდნის სისტემური რევიზია და აქტუალიზაცია, როგორც თეორიული ლინგვისტიკის განვითარების ერთ-ერთი წინაპირობა (ე.წ. თეორიული განახლება –  update);

• კვლევის „ტექნოლოგიზება“ – კვლევის შედეგების ტექნოლოგიურ პროდუქტად გარდაქმნა, რომელსაც პრაქტიკული გამოყენება ექნება როგორც მეცნიერების სხვადასხვა დარგებში, ისე ფართო საყოფაცხოვრებო სამომხმარებლო სფეროში (ტექნოლოგიური შედეგი – output).

ზემოთქმულიდან გამომდინარე, კორპუსლინგვისტიკის ამოცანა შეიძლება ამგვარად განვსაზღვროთ:

I. კორპუსის გენერირება (ტექნოლოგიური ჩარჩოს შექმნა)

II. კორპუსის ემპირიული მასალებით შევსება

III. ლინგვისტური თეორიების განახლება/აქტუალიზაცია

IV. კორპუსის შედეგების ტექნოლოგიზება

Presentation1

 

კორპუსის შექმნას, როგორც წესი, წინ უსწრებს კორპუსის კონცეპტუალიზაცია (ანუ იმის წინასწარი განსაზღვრა, რა ტიპის კორპუსს ვქმნით, რა რესურსებს უნდა მოიცავდეს კორპუსი, ვინ უნდა იყოს კორპუსის მომხმარებელი და რა სამომხმარებლო მოთხოვნილებებს უნდა აკმაყოფილებდეს იგი), რომელიც კორპუსის შექმნის აქ ჩამოთვლილი პირობებს უნდა აკმაყოფილებდეს.