„კვლევის“ გაგებისათვის კორპუსლინგვისტიკაში

ტრადიციული ლინგვისტიკა ემპირიული ფაქტების ანალიზს ემყარებოდა. კორპუსლინგვისტიკაც ემპირიულ ფაქტებს ეყრდნობა, ოღონდ გაცილებით უფრო დიდი მოცულობის ფაქტებს. გადაჭარბებული არ იქნება თუ ვიტყვით, რომ თანამედროვე თეორიული ლინგვისტიკა არსებითად კორპუსულ კვლევებს იყენებს – დღეს ცნება „კვლევა“ ცალსახად „კორპუსზე ორიენტირებულ კვლევას“ გულისხმობს, ხოლო გრამატიკა – „კორპუსულ გრამატიკას“. ნათქვამის დასტურად გამოდგება მაგალითად, ფრანტისეკ შტიხას (Frantisek Štícha) მიერ დაარსებული საერთაშორისო კონფერენციების სერია „გრამატიკა და კორპუსები“. საერთაშორისო კონფერენციის ეს სერია 2005 წელს ჩატარდა პირველად ჩეხეთში და 2009 წლიდან გადმოინაცვლა გერმანიაში. თავდაპირველად სლავურ ენებზე ფოკუსირებული კონფერენცია სულ მალე იქცა კორპუსული გრამატიკის სადისკუსიო ფორუმად, სადაც სხვადასხვა ენის კორპუსული კვლევების რელევანტური შედეგები არის სამეცნიერო დისკუსიის ობიექტი.

თანამედროვე ენათმეცნიერება კორპუსთან მიმართებაში ორი სახის კვლევას იყენებს: კორპუსზე დამყარებულ კვლევებს და კორპუსით განპირობებულ კვლევებს.

1. კორპუსზე დამყარებული კვლევა

კორპუსზე დამყარებულ კვლევაში (Corpus-based studies)  იგულისხმება მეთოდი, რომელიც საშუალებას იძლევა შევამოწმოთ ლინგვისტური ჰიპოთეზის ვალიდურობა კორპუსზე დაყრდნობით. ხაზგასასმელია ის ფაქტი, რომ ჰიპოთეზის ჩამოყალიბება ამ შემთხვევაში არ უკავშირდება კორპუსულ კვლევას; კორპუსის ბაზაზე ხდება თეორიული მოსაზრების სისწორისა და დეტალურობის ხარისხის შემოწმება. კორპუსზე დამყარებული კვლევის შედეგად ვახდენთ წესის ან ჰიპოთეზის ვერიფიცირებას ან ფალსიფიცირებას.

თვალსაჩინოებისათვის განვიხილოთ ერთი მაგალითი – „ლიმონი“. ქართული ენის განმარტებით ლექსიკონში ლიმონი დახასიათებულია, როგორც ფუძეკუმშვადი სახელი – ფრჩხილებში მითითებულია ნათესაობითში შეკუმშული ფორმა: ლიმონ-ი (ლიმნისა).

თუ საილუსტრაციოდ მოტანილ მაგალითებს გადავავლებთ თვალს, აღმოვაჩენთ, რომ მაგალითებში შეკუმშული ფორმის – ლიმნის – გვერდით ერთხელ მხოლობითი რიცხვის შეუკუმშავი ფორმაა დადასტურებული (ლიმონის ხე), ერთხელ კი მრავლობითი რიცხვის შეუკუმშავი ფორმა (ფცქვნიდა ლიმონებს…).

ai, ak unda chasva limnis faili!!!!!!!!!!

ცხადია, რომ განმარტებითი ლექსიკონის მიხედვით ცალსახად ვერ ვუპასუხებთ კითხვას, კუმშვადია თუ არა „ლიმონი“ ქართულში.

ქართული ენის ეროვნულ კორპუსში ამ ლექსემასთან დაკავშირებით შემდეგი სურათი გვაქვს:

ლიმონი (5), ლიმონმა (3), ლიმონს (50), ლიმნის (38) შდრ. ლიმონის (157), ლიმნით (3) შდრ. ლიმონით (27),  ლიმონად (5), ლიმნები (3) შდრ. ლიმონები (23), ლიმონებს (6), ლიმნების (1) შდრ. ლიმონების (4), ლიმნებით (1) შდრ. ლიმონებით (1).

კორპუსში დადასტურებული ფორმების სტატისტიკური ანალიზი ცალსახად გვიჩვენებს ტენდენციას ქართულში სიტყვა ლიმონი უკუმშველი ფუძის ფორმით გამოიყენოს. შესაბამისად, კორპუსული კვლევების მიხედვით არავითარი საფუძველი არ გაგვაჩნია ლიმონი ცალსახად კუმშვად არსებით სახელად მივიჩნიოთ, როგორც ეს ქართული ენის განმარტებით ლექსიკონშია მითითებული.

2. კორპუსით განპირობებული ლინგვის­ტური კვლევა

კორპუსით განპირობებული ლინგვის­ტური კვლევა (Corpus-driven studies)  გულისხმობს მეთოდს, რომლის დროსაც ლინგვისტური ჰიპოთეზის ჩამოყალიბება იმთავითვე უკავშირდება კორპუსს, ანუ მეცნიერული პრობლემის დასმის წყაროს წარმოადგენს კორპუსში წარმოებული კვლევის შედეგების ანალიზი.

კვლევის ეს ორი მეთოდი (კორპუსზე დაყარებული ლინგვისტური კვლევა და კორპუსით განპირობებული ლინგვის­ტური კვლევა) ერთმანეთისაგან იმით განსხვავდება, რომ პირველ შემთხვევაში საქმე გვაქვს ჰიპოთეზის ვალიდურობის შემოწმებასთან, მეორე შემთხვევაში კი ჰიპოთეზის გენერირებასთან. ორივე შემთხვევაში შედეგად ვიღებთ ჰიპოთეზის ვერიფიკაციას ან ფალსიფიკაციას.

ზოგიერთი ავტორი (მაგ.,Elena Tognini-Bonelli, Corpus Linguistics at Work, 2001: 84–5)  ამ მეთოდზე დაყრდნობით თვლის, რომ  ენობრივი კორპუსი თავად „ქმნის“ ენის თეორიას (იხ. აგრეთვე ჯონ ფირსის (John R. Firth)  პოლისისტემატიზმი).

კორპუსში ორი სახის ძიება არის  შესაძლებელი: ე.წ. KWIC–ძიება  (key word in context) ანუ ცალკეული სიტყვების ძიება კონტექსტში და KRIC –ძიება (key relation in context) ანუ მიმართებების ძიება კონტექსტში.

KWIC–ძიების შემთხვევაში წარმოიქმნება კონკორდანსი  (concordance). კონკორდანსის ცნება, რომელიც თავდაპირველად ბიბლიათმცოდნეობაში, შემდგომ კი ლიტერატურათმცოდნეობაში გამოიყენებოდა, კორპუსლინგვისტიკის ერთ-ერთ ძირეულ ცნებას წარმოადგენს. კონკორდანსი არის ანბანურ რიგზე დალაგებული სიტყვების ან ფრაზების სია და მისი გენერირება კორპუსში წარმოებს სპეციალური ალგორითმული სისტემის, კონკორდანსერის მეშვეობით. კონკორდანსის სინონიმებად გამოიყენება აგრეთვე რეგისტრი ან ინდექსი. კორპუსლინგვისტიკაში გამოყენებული ცნება კონკორდანსი იმით განსხვავდება სიტყვების უბრალო ჩამონათვალისაგან, რომ იგი, ინდექსისაგან განსხვავებით, ცალკე ამოღებული სიტყვების ჩამონათვალი კი არ არის, არამედ გვიჩვენებს სიტყვათა ადგილს იმ კონტექსტში, რომელშიც იგი გვხვდება.

კორპუსით განპირობებული კვლევის საილუსტრაციოდ განვიხილოთ ზედ ელემენტის KWIC–ძიების შედეგები.

ზედ ელემენტი ქართული ენის ეროვნულ კორპუსში 4916-ჯერ დასტურდება. შესაბამისი კონტექსტების პირველადმა ანალიზმა ცხადყო, რომ ზედ ელემენტი მიღებულ კონკორდანსში განსხვავებული ფუნქციებით გამოიყენება. განვიხილოთ რამდენიმე მაგალითი:

(1) ტახტთან ტაბურეტი მოვაჩოჩე, ზედ არყის ბოთლი შემოვდგი.

(2) ბრალი დასდეს: შენი წაღებულია ხერხი, ზედ შენი თითის ანაბეჭდებიაო…

(3) გამჭოლი მზერით მიანიშნებდა პატარა მაგიდისაკენ, რომელიც იქვე, გასასვლელ კართან იდგა და ზედ ნაკურთხი პური, ღვინო და ზეთი ეწყო.

(4) შევარდნაძე კი სხვანაირად ფიქრობს, მას წასვლა ჯერ არ უნდა, ზედ უნდა დააკვდეს იმ სკამს, როგორც ზვიად გამსახურდია დააკვდა.

(5) საქართველოს ალამი ზედ ცხვირწინ ჩამომაფხრიწეს.

(6) მთაწმინდაზე გაუთხარეს სამარე, ზედ ილიას გვერდით.

პირველ ორ მაგალითში ზედ დამოკიდებული წინადადების ინიციალურ პოზიციაში დგას და მიემართება მთავარი წინადადების ერთ-ერთ წევრს – პირველ წინადადებაში ტაბურეტს, მეორეში – ხერხს. ჩვენი მოსაზრების შესამოწმებლად შეგვიძლია გამოვიყენოთ სინტაქსური მოდიფიკაციის წესი (მთავარი და დამოკიდებული წინადადება გარდავქმნათ ორ მარტივ წინადადებად) და ლექსიკური სუბსტიტუციის წესი (ზედ ელემენტი ჩავანაცვლოთ მთავარი წინადადების იმ წევრებით, რომელსაც ის მიემართება: ტაბურეტი და ხერხი):

(1ა) ტახტთან ტაბურეტი მოვაჩოჩე, ზედ არყის ბოთლი შემოვდგი >

ა) ტახტთან ტაბურეტი მოვაჩოჩე

ბ) ტაბურეტზე არყის ბოთლი შემოვდგი

(2ა) ბრალი დასდეს: შენი წაღებულია ხერხი, ზედ შენი თითის ანაბეჭდებიაო>

ა) ბრალი დასდეს, შენი წაღებულია ხერხი

ბ) ხერხზე შენი თითის ანაბეჭდებიაო

პირველ მაგალითში ორი შესაძლებლობიდან – ტახტზე და ტაბურეტზე ლოგიკური შესაბამისობიდან გამომდინარე, მხოლოდ უკანასკნელი ვარიანტია დასაშვები (ტაბურეტზე). არჩევანის სიზუსტე ამ შემთხვევაში კონტექსტის  ანალიზით არის განპირობებული.

მომდევნო, მესამე მაგალითში ზედ ელემენტი მიემართება მიმართებით ნაცვალსახელს „რომელიც, რომელიც თავის მხრივ მთავარი წინადადების ერთ-ერთ წევრს – ადგილის გარემოებას (მაგიდისაკენ) მიემართება. ზემოთ გამოყენებული წესების შესაბამისად მესამე წინადადების ტრანსფორმაციის შემთხვევაში მივიღებთ შემდეგ ვარიანტებს:

  (3ა) გამჭოლი მზერით მიანიშნებდა პატარა მაგიდისაკენ, რომელიც იქვე, გასასვლელ კართან იდგა და ზედ ნაკურთხი პური, ღვინო და ზეთი ეწყო.

ა) გამჭოლი მზერით მიანიშნებდა პატარა მაგიდისაკენ

ბ) მაგიდა იქვე, გასასვლელ კართან იდგა

გ) მაგიდაზე ნაკურთხი პური, ღვინო და ზეთი ეწყო.

აშკარაა, რომ ზემოთ განხილულ მაგალითებში ზედ ელემენტი რამდენიმე ფუნქციას ითავსებს:

ა) დეიქტური ფუნქციით გვევლინება,

ბ) ანაფორას წარმოადგენს და

გ) დამატებით სუპერესიულობას გამოხატავს – ლექსიკური სუბსტიტუციის შემთხვევაში ჩანაცვლებული სახელი ზე-თანდებულით ფორმდება.

ზედ ელემენტი კატაფორული ფუნქციითაც შეიძლება შეგვხვდეს, როგორც, მაგალითად, მომდევნო, მეოთხე წინადადებაში:

4) შევარდნაძე კი სხვანაირად ფიქრობს, მას წასვლა ჯერ არ უნდა, ზედ უნდა დააკვდეს იმ სკამს, როგორც ზვიად გამსახურდია დააკვდა.

ზედ ელემენტი წინ უსწრებს მისამართ სიტყვას და შესაბამისად კატაფორულია.

რაც შეეხება მეხუთე წინადადებას (საქართველოს ალამი ზედ ცხვირწინ ჩამომაფხრიწეს), აქ ზედ ელემენტს სულ სხვა ფუნქცია გააჩნია. ზედ ელემენტის პოვნიერების თვალსაზრისით უპირველეს ყოვლისა, აღსანიშნავია ორი არსებითი მნიშვნელობის გარემოება:

  • აღნიშნული წინადადება წინა მაგალითებისაგან განსხვავებით მარტივი წინადადებაა;
  • ზედ ელემენტი ელიმინირებადია – მისი ამოღებით წინადადების ფაქტობრივი შინაარსი არ იცვლება.

შევადაროთ ამ წინადადების ორი ვერსია ერთმანეთს: ერთი ზედ ელემენტით, მეორე, ზედ ელემენტის გარეშე.

ა) საქართველოს ალამი ზედ ცხვირწინ ჩამომაფხრიწეს.

ბ) საქართველოს ალამი ზედ ცხვირწინ ჩამომაფხრიწეს.

პირველი ვერსია მეორისაგან იმით განსხვავდება, რომ პირველში მთქმელის პირადი დამოკიდებულება, ინტენცია არის მოცემული წინადადებით გადმოცემული ფაქტის მიმართ. ზედ ელემენტის ამოღების შემდეგ კი ეს ინტენცია განეიტრალდა – წინადადება “საქართველოს ალამი ცხვირწინ ჩამომაფხრიწეს“ მომხდარ ფაქტს აღწერს ყოველგვარი მოდალობის გარეშე. ზედ ელემენტი, შესაბამისად, მოდალურ ელემენტად უნდა იქნეს მიჩნეული.

ზედ ელემენტის მოდალურობა უკეთესად “იკითხება” მეექვსე წინადადებაში – მთაწმინდაზე გაუთხარეს სამარე, ზედ ილიას გვერდით.. ზედ ელემენტი ამ შემთხვევაში აპოზიციაში დასტურდება (ზედ ილიას გვერდით) და გარდა ამისა, აშკარად უარყოფითი კონოტაციის მატარებელია: მთქმელი აღშფოთებულია იმ ფაქტით, რომელიც წინადადებაში არის აღწერილი (მავანს მთაწმინდაზე გაუთხარეს სამარე, თანაც ილიას გვერდით!). სემანტიკური ფუნქციის თვალსაზრისით, აქ დარღვეულია პრესუპოზიციურობა, რის გამოც ზედ ელემენტი მოდალობის, კერძოდ, კონტრაპრესუპოზიციულობის გამომხატავ ელემენტად მიგვაჩნია.

ამგვარად, დასკვნის სახით შეგვიძლია ვთქვათ, რომ ზედ ელემენტი ქართულში ფუნქციონირებს როგორც:

  1. ადგილის ზმნიზედა;
  2. (ფსევდო)ანაფორა ან კატაფორა;
  3. დეიქტური ელემენტი (იწვევს დეიქტურ სპეციფიკაციას);
  4. მოდალური ელემენტი (კონტრაპრესუპოზიციული დადასტურება).

დასკვნები, რომელიც ზედ ელემენტის კორპუსული კვლევის შედეგად მივიღეთ, კორპუსით განპირობებული კვლევის შედეგია. კვლევის ეს შედეგები  კიდევ ერთხელ მოწმდება კორპუსში, რათა მოხდეს ჩვენს მიერ დასკვნაში მოცემული ლინგვისტური ჰიპოთეზის ვერიფიცირება.

ზედ ელემენტის სემანტიკური ფუნქცია გარკვეულ კანონზომიერებაშია მის ტოპოლოგიასთან: დეიქტური ფუნქციით, როგორც წესი,  ზმნის წინა (ან წინადადების ერთი წევრით დაშორებულ) პოზიციაში გვხვდება, ანაფორის შემთხვევაში დამოკიდებული წინადადების ინიციალურ პოზიციას იკავებს, მოდალური მნიშვნელობით კი სახელის წინ დგას.

დაკვირვების შედეგად აღმოჩენილი კანონზომიერების ვერიფიცირებისათვის გამოვიყენეთ KRIC-ძიების მეთოდი შემდეგი რეგულარული გამოსახულებებით:

KRIC:

  • Expression 1.
    • „ზედ“ [ ]? [features=“V.*“]
  • Expression 2.
    • „ზედ“ [ ]? [features=“N.*“&“!=x“] while x=corresponding suffix
  • Expression 3.
    • „ზედ“ [ ]{0,3} „.*ზე“ 274 contexts

KRIC-ძიების შედეგად გენერირებულმა კონკორდანსმა, ამჯერად საგრძნობლად შემცირებული რაოდენობის ბაზაზე, კიდევ ერთხელ დაგვიდასტურა ჩვენი მოსაზრება ზედ ელემენტის მოდალური ფუნქციით გამოყენების შესახებ. საილუსტრაციოდ მოვიტანთ რამდენიმე მაგალითს:

პირამდე ავსებული ურნა ვიღაცას ზედ ტროტუარ-ზე გადაეპირქვავებინა.

ზედ ელემენტი, როგორც წესი, ზე-თანდებულიანი სახელის წინ დგას, თუმცა რამდენიმე მაგალითი დადასტურდა, სადაც ზე-თანდებულის ნაცვლად სხვა თანდებული დასტურდება:

ვახტანგს სახლი ზედ ტბასთან ედგა.

აღნიშნული განსხვავება სემანტიკური ფუნქციის თვალსაზრისით სასურველია აისახოს ქართული ენის ანოტირებულ კორპუსში, რისთვისაც აუცილებელია ანოტაციის დონეებში ახალი, პრაგმატული დონის შემოღება.