ცნებები „ქართული ენა“ და „ქართული“ კორპუსლინგვისტიკაში

ვიდრე დიგიტალური ქართველოლოგიის განვითარების ერთ-ერთი უმნიშვნელოვანეს რესურსს, ქართული ენის ეროვნულ კორპუსს გაგაცნობთ, მოდით, ვისაუბროთ ერთ საკითხზე: რას ნიშნავს ცნებები „ქართული ენა“ და „ქართული“კორპუსლინგვისტიკაში.

ცნებების „ქართული ენა“ და „ქართული“ შეპირისპირებისას ავტომატურად იქმნება ქართული ენის სტანდარტული სალიტერატურო ვერსიისა („ქართული ენა“) და მისი რეალური მოხმარების შედეგად მიღებული ვარიანტების („ქართული“) სინოფსისი.

საგანგებოდ გვინდა გავუსვათ ხაზი იმ გარემოებას, რომ  ცნებების „ქართული ენა“ და „ქართული“ შეპირისპირება არ ემთხვევა დიქოტომიას „სალიტერატურო ქართული“ vs. „არასალიტერატურო ქართული“. მაგალითად, ქართულად მოლაპარაკე მოსამართლე სასამართლო დარბაზში ცალსახად  სალიტერატურო ქართულით მეტყველებს ისევე, როგორც ქართულად მოსაუბრე ექიმი საუბრობს სალიტერატურო ქართულით კოლეგებთან კონსილიუმის დროს. თუმცა აშკარაა, რომ ორივე „ენა“ ერთმანეთისაგან ბევრი მახასიათებლით განსხვავდება.

დიქოტომიები „ქართული ენა“ vs. „ქართული“ და „სალიტერატურო ქართული“ vs. „არასალიტერატურო ქართული“ აქ სხვადასხვა განზომილებაში განიხილება და ერთმანეთს მხოლოდ ნაწილობრივ ეკვეთებიან. „ქართული ენა“ გულისხმობს „ძველ ქართულს“, „საშუალ ქართულს“ და „ახალ ქართულს“, მაშინ როდესაც „ქართული“ გულისხმობს ენის მოხმარების ყველა ემპირიულად მოცემულ ენობრივ ფაქტს როგორც სინქრონიული, ისე დიაქრონიული თვალსაზრისით.

კორპუსლინგვისტიკის პერსპექტივიდან საინტერესოა არა „ქართული ენა“, როგორც დადგენილი ზოგადი გრამატიკული წესების მიხედვით ფორმულირებული „სწორი“ ქართული, არამედ „ქართული“, როგორც ქართული ენის ენობრივი კომპეტენციის მოხმარების ემპირიული ფენომენი კოგნიტურ, სოციალურ და კულტურულ ასპექტებთან კონტექსტში – სივრცესა და დროში.

ქართული ენის გრამატიკა აღწერს ქართული ენის ფუნქციონირების გრამატიკულ წესებს ერთი ეპოქის ჩარჩოებში. კორპუსს კი ძალუძს ასახოს ქართულის ფუნქციონირების ყველა – გრამატიკული და არაგრამატიკული – ენობრივი შემთხვევა  ემპირიულად წვდომად რესურსებზე დაყრდნობით, როგორც სინქრონიულ, ისე დიაქრონიულ ჭრილში.

ქართული ენის გრამატიკა ენობრივ სისტემას აღწერს სტატიკური  ფორმით. ქართული ენის კორპუსი აღწერს ამ სისტემის შექმნის, ცვლილების და ფუნქციონირების დინამიკას სისტემური, პარადიგმული დომინირება-მინიმირების ასახვის ფორმით.

ენათა სწრაფი ტექნოლოგიზების ეპოქაში მსოფლიო ენათა სისტემატიზაციის  პარადიგმატიკაში ახალი ცნება გაჩნდა, რომელიც ენის აღწერის უკავშირდება: described – semi-described – over-described.  semi-described სიტყვასიტყვით თარგმანში ნიშნავს „სანახევროდ/ნაწილობრივ აღწერილ ენას”, თუმცა აქ იგულისხმება არა „აღწერა“ ტრადიციული გაგებით, არამედ ენის ტექნოლოგიზება. ანუ  semi-described –ენა უნდა გავიგოთ, როგორც „ნახევრად/ნაწილობრივ ტექნოლოგიზებული ენა“, ხოლო over-described -ენა, როგორც „ზეტექნოლოგიზებული ენა“

„ქართული“ semi-described ენათა რიცხვს მიეკუთვნება, რადგან  ლინგვისტური პორტალის „დიგიტალური ქართველოლოგია“ შედგენის მომენტისათვის „ქართული“ განკარგავს ფუნქციონირებად კორპუსულ ლანდშაფტს – ქართული ენის ეროვნულ კორპუსს GNC, ქართული ენის კორპუსკულს (GEKKO), ქართულ დიალექტურ კორპუსს (GDC), ზეპირმეტყველების ელექტრონულ კორპუსს „სოციოლინგვისტური სიტუაცია თანამედროვე საქართველოში“ (SSGG), მაგრამ ქართული ჯერჯერობით ვერ დახასიათდება როგორც  over-described-ენა. ამის მიზეზი კი სწორედ „ქართული“-ს გაგებაში დევს – ქართული ენის ეროვნული კორპუსი დღეისათვის ჯერ კიდევ არ მოიცავს ქართული ენის ენობრივი კომპეტენციის მოხმარების ემპირიულ რესურსებს კოგნიტურ, სოციალურ და კულტურულ ასპექტებთან კონტექსტში – სივრცესა და დროში.

1. რა არის „ქართული“?

ცნებების „ქართული ენა“ vs. „ქართული“ შეპირისპირებისას შევეცადეთ ამ ცნებების განსასაზღვრად ნაწილობრივ გამოგვეყენებინა ინტერდეტერმინაციის ძველი მეთოდი. „ნაწილობრივ“ იმიტომ, რომ ცალკე აღებული კითხვა „რა არის ქართული?“ ჩვენი აზრით, მეთოდურად მცდარი კითხვაა. მეთოდურად სწორი იქნებოდა კითხვის შემდეგნაირად ფორმულირება: „რამდენი ‚ქართული‘ არსებობს?“. ამ კითხვის საპასუხოდ ჩამოვწერთ მოკლე სიას, რომელსაც სისრულის პრეტენზია არ გააჩნია:

• ლექტორის „ქართული“ მონოლოგში

• პოლიტიკოსის „ქართული“

• გამომცხადებლის „ქართული“ მატარებლების სადგურზე

• ექიმის „ქართული“ პაციენტის გამოკითხვისას

• გამომძიებლის „ქართული“ დაკითხვისას

• ძველბიჭური „ქართული“

• მზარეულის „ქართული“ კერძის რეცეპტის ახსნისას

• ამბიონიდან ქადაგების „ქართული“

• თამადის „ქართული“ თანამეინახეებთან ინტერაქციაში

• სასამართლოს „ქართული“ სასამართლო პროცესის დროს

• ნასვამი ადამიანის „ქართული“

• მცირეწლოვანი ბავშვის „ქართული“

• თინეიჯერის „ქართული“

• ტელეფონზე საუბრის „ქართული“

• მესიჯის „ქართული“

• რეკლამის „ქართული“

• ყრუ-მუნჯური „ქართული“

• მუზეუმის გიდის „ქართული“

ჩატის „ქართული“

• და ა.შ. „ქართული“

იმისათვის, რომ ამ ჩამონათვალმა (გაცილებით ინტენსიური) ექსპონენციალური ხასიათი მიიღოს, მსჯელობაში შემოვიტანთ კატეგორიზირების ახალ განზომილებას, რომლის თითოეული წევრი მიემართება ზემოთ ჩამოთვლილ 20-ივე „ქართულს“ (იმის გათვალისწინებით, რომ ეს ჩამონათვალი თავის მხრივ „ქართულის“ არასრული სიაა).

დამატებით შემოტანილი ეს განზომილება, როგორც წესი, შეიცავს ცვლადებს (ვარიანტებს), რომელთა ნეიტრალიზება (კონტროლი) ლინგვისტური ექსპერიმენტების დიზაინის დროს უპირველეს ამოცანას წარმოადგენს: გენდერი, ასაკობრივი ჯგუფი, დიალექტური ფონი, მიგრაციული ფონი, აკადემიური ფონი, სოციალური ჯგუფი, პროფესიული გილდია და ა.შ.

განვიხილოთ პირველი სამი ცვლადი „ქართულის“ ჩამონათვალის მხოლოდ პირველ წევრთან.

1. გენდერი

(ანუ მაგალითად [1. ლექტორი ქალის „ქართული“ მონოლოგში და ლექტორი მამაკაცის „ქართული“ მონოლოგში]  და ასე შემდეგ 20-ვე კატეგორიის „ქართული“)

2. ასაკობრივი ჯგუფი

(ანუ [1. ახალგაზრდა ლექტორი ქალის „ქართული“ მონოლოგში და ახალგაზრდა ლექტორი მამაკაცის „ქართული“ მონოლოგში; 1.1. ასაკოვანი ლექტორი ქალის „ქართული“ მონოლოგში და ასაკოვანი ლექტორი მამაკაცის „ქართული“ მონოლოგში;]  და ასე შემდეგ 20-ვე კატეგორიის „ქართული“).

3. დიალექტური ფონი

(ანუ [1. ახალგაზრდა ლექტორი ქალის „ქართული“ მონოლოგში 1. მოხევური, 2. მთიულურ-გუდამაყრული, 3. ხევსურული, 4. ფშავური, 5. თუშური, 6. ინგილოური, 7. ფერეიდნული, 8. თიანეთური, 9. ქართლური, 10. ჯავახური, 11. მესხური, 12. გურული, 13. აჭარული, 14. იმერხეული, 15. იმერული, 16. ლეჩხუმური დიალექტური შეფერილობით და ახალგაზრდა ლექტორი მამაკაცის „ქართული“ მონოლოგში 1. მოხევური, 2. მთიულურ-გუდამაყრული, 3. ხევსურული, 4. ფშავური, 5. თუშური, 6. ინგილოური, 7. ფერეიდნული, 8. თიანეთური, 9. ქართლური, 10. ჯავახური, 11. მესხური, 12. გურული, 13. აჭარული, 14. იმერხეული, 15. იმერული, 16. ლეჩხუმური დიალექტური შეფერილობით])

ისევე როგორც,

[1. ასაკოვანი ლექტორი ქალის „ქართული“ მონოლოგში 1. მოხევური, 2. მთიულურ-გუდამაყრული, 3. ხევსურული, 4. ფშავური, 5. თუშური, 6. ინგილოური, 7. ფერეიდნული, 8. თიანეთური, 9. ქართლური, 10. ჯავახური, 11. მესხური, 12. გურული, 13. აჭარული, 14. იმერხეული, 15. იმერული, 16. ლეჩხუმური დიალექტური შეფერილობით და ასაკოვანი ლექტორი მამაკაცის „ქართული“ მონოლოგში 1. მოხევური, 2. მთიულურ-გუდამაყრული, 3. ხევსურული, 4. ფშავური, 5. თუშური, 6. ინგილოური, 7. ფერეიდნული, 8. თიანეთური, 9. ქართლური, 10. ჯავახური, 11. მესხური, 12. გურული, 13. აჭარული, 14. იმერხეული, 15. იმერული, 16. ლეჩხუმური დიალექტური შეფერილობით].

და ასე შემდეგ 20-ვე კატეგორიის „ქართული“.

სამი ბინარული (პროფესია, გენდერი და ასაკობრივი ჯგუფი) და ერთი (16 ქვეკატეგორიად დაყოფილი: 1. მოხევური, 2. მთიულურ-გუდამაყრული, 3. ხევსურული, 4. ფშავური, 5. თუშური, 6. ინგილოური, 7. ფერეიდნული, 8. თიანეთური, 9. ქართლური, 10. ჯავახური, 11. მესხური, 12. გურული, 13. აჭარული, 14. იმერხეული, 15. იმერული, 16. ლეჩხუმური)   კრიტერიუმით (დიალექტური ფონი) მივიღებთ ათას ორას ოთხმოც (20x2x2x16=1.280) პოტენციურად შესაძლებელ „ქართულს“. თითოეული ციფრის მცირე მანიპულაციაც კი ექსტროვერტულად ცვლის საბოლოო ციფრს.

კორპუსის „სიკეთე“ იმაში მდგომარეობს, რომ მასში ადგილი იძებნება „ქართულის“ უგამონაკლისოდ ყველა – ემპირიულად მოპოვებადი ფორმისათვის. ეს ფაქტი მიუთითებს კორპუსის ტექნოლოგიურ სიმძლავრეზე და თავისი მასშტაბურობიდან გამომდინარე, ქმნის გაცილებით შორსმიმავალ რეალობას: „ქართულის“ კორპუსი გვაძლევს არა მარტო ენის გრამატიკული სისტემის დინამიკურ სურათს, არამედ ქმნის „ქართულზე“ დაფუძნებული თანამედროვე ტექნოლოგიების შექმნის შესაძლებლობებს.  ეს არის ფუნდამენტური მიზეზი იმისა, თუ რატომ „აინტერესებს“ კორპუსს „ქართული ენის“ კომპეტენციის მოხმარების ყველა შესაძლებელი ვარიანტი, რაც საერთო ჯამში ქმნის კორპუსის „ქართულს“.

ენის მოხმარებას გააჩნია ბუნებრიობის ერთ-ერთი ყველაზე არსებითი მახასიათებელი: იგი შეიძლება იყოს მცდარი! მცდარი „ქართული“ ვერასოდეს ვერ მოხვდება „ქართული ენის“ გრამატიკის სახელმძღვანელოში, მაგრამ მცდარი „ქართული“ აუცილებლად უნდა იყოს „ქართულის“ ნაწილი!

რატომ? დავფიქრდეთ, რამდენჯერ აგვიკრეფია google-ში საძიებო სიტყვა მცდარად. google-ი რომ ცნებების მხოლოდ  სწორ, ანუ კორექტულ დაწერილობას „იცნობდეს“, მასში ძებნა გაცილებით არაეფექტური, მეტიც არაეფიციენტური  იქნებოდა. სწორედ საძიებო სისტემის ეფიციენტურობის მისაღწევად „აგროვებდა“google-ი მრავალი წლის განმავლობაში, ავტომატურ რეჟიმში,  ყველა მცდარად აკრეფილ სიტყვას და მის მიმართებას კორექტულ ვერსიასთან. ამგვარად გაიმართა ძებნის ეფიციენტური ალგორითმი, რომელიც მცდარ სიტყვას „არემონტებს“ და მაინც პოულობს მისი კორექტული ვერსიის შემცველ კონტექსტებს.

გერმანული ენის ზეპირმეტყველების კორპუსი (IDS) შეიცავს „ალკოჰოლიზირებული გერმანული ენის“ ექსპლიკატების ფართო სპექტრს. ეს ექსპლიკატები დიდ ცდომილებაშია „სწორ“ გერმანულთან გრამატიკული აღწერის თითქმის ყველა დონეზე. გერმანული ენის გრამატიკის არცერთი წიგნი არ შეიცავს ამ ფრაზებს და წინადადებებს, სამაგიეროდ ამ კორპუსიდან გენერირებული ენის ამოცნობის ტექნოლოგია გამოყენებულია ხმოვანი სიგნალებით მართულ ყველა ლიფტში, რომლითაც ფხიზელი გერმანელების გარდა ნასვამი გერმანელებიც სარგებლობენ.

„ქართულს“ უნდა გააჩნდეს კორპუსი არა მარტო იმიტომ, რომ ენა ვიკვლიოთ გრამატიკული საჭიროების გამო. „ქართულს“ უნდა გააჩნდეს კორპუსი იმისათვის, რომ გახდეს 21-ე საუკუნის სრულფასოვანი over-described-ენა, რომლისაც ესმით არა მარტო ადამიანებს, არამედ თანამედროვე ტექნოლოგიურ აპარატურასაც.