ქართული ენის ეროვნული კორპუსის შექმნის ისტორია და საფუძვლები

ქართული ენის ეროვნული კორპუსის შექმნა დაიწყო 2012 წელს, როდესაც მეცნიერების განვითარების გერმანულმა ფონდმა VW-Stiftung (Volkswagen Stiftung) დააფინანსა იოსტ გიპერტისა და მანანა თანდაშვილის მიერ წარდგენილი საერთაშორისო სამეცნიერო პროექტი „ქართული ენის ეროვნული კორპუსი: ტექნოლოგიური ჩარჩოს შექმნა“ (2012-2014).

ქართული ენის ეროვნული კორპუსის ელექტრონული რესურსების საფუძველს წარმოადგენდა ის ელექტრონული რესურსების ნაკრები, რომელიც იქმნებოდა სამეცნიერო პროექტების სახით ფრანკფურტის გოეთეს სახ. უნივერსიტეტის ემპირიული ენათმეცნიერების ინსტიტუტში გერმანელ და ქართველ მეცნიერთა მონაწილეობით და განთავსებული იყო გერმანიაში (TITUS -ისა (Thesaurus Indogermanischer Text- und Sprachmaterialien) და ARMAZI-ს (Fundamentals of an Electronic Documentation of Caucasian Languages and Cultures – Alternative Resources, Materials, Applications and Zipped Information) ქართული რესურსები), ნორვეგიაში (Clarino), ჰოლანდიასა (Max Plank Institute, Language Archive)  და საქართველოში (ქართული დიალექტური კორპუსი, opentext და lib.ge).

ამდენად, ქართული ენის ეროვნული კორპუსი ეყრდნობა დიგიტალურ რესურსებს, რომელიც გასული საუკუნის 80-იანი წლებიდან იქმნებოდა საქართველოსა და მის ფარგლებს გარეთ და მოიცავს როგორც წერილობით, ისე ზეპირმეტყველების წერილობით დოკუმენტირებულ და გაციფრებულ რესურსებს:

  1. TITUS -ის (Thesaurus Indogermanischer Text- und Sprachmaterialien) ქართული რესურსები (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელი იოსტ გიპერტი), რომელიც მოიცავს ძველი და საშუალი ქართულის ორიგინალურ და ნათარგმნ ძეგლებს.
  2. კავკასიური ენების ელექტრონული პორტალის ARMAZI-ს (Fundamentals of an Electronic Documentation of Caucasian Languages and Cultures) ქართული რესურსები (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელები: იოსტ გიპერტი და მანანა თანდაშვილი), რომელშიც შესულია 1999-2008 წლებში გაციფრებული რესურსები ძველი, საშუალი და ახალი ქართულიდან.
  3. სამეცნიერო პროექტები ECLinG (საფრთხეში მყოფი კავკასიური ენები საქართველოში) და SSGG (სოციოლინგვისტური სიტუაცია თანამედროვე საქართველოში) ფარგლებში ჩაწერილი ქართული ენის ზეპირმეტყველების აუდიო-ვიდეო მასალები, რომელიც ინახება ჰოლანდიაში, ნეიმეხენის მაქს პლანკის ინსტიტუტის ენის დიგიტალურ არქივში (გერმანია, ფრანკფურტის უნივერსიტეტი, პროექტის ხელმძღვანელები: იოსტ გიპერტი და მანანა თანდაშვილი).
  4. ქართული დიალექტური კორპუსის (GDC) რესურსები (საქართველო, არნ. ჩიქობავას სახ. ენათმეცნიერების ინსტიტუტი, ხელმძღვანელი: მარინე ბერიძე), რომელიც სამეცნიერო პროექტების განხორციელების შედეგად იქმნებოდა და ფინანსდებოდა ღია საზოგადოება საქართველოსა და რუსთაველის მეცნიერების განვითარების ეროვნული ფონდის მიერ. აღნიშნული კორპუსი წარმოადგენს ქართული ენის ზეპირმეტყველების კორპუსს და მოიცავს უნიკალურ ეთნოლინგვისტურ მასალას. მასში შესულია როგორც არნ. ჩიქობავას სახ. ენათმეცნიერების არქივში დაცული დიალექტური ექსპედიციების მასალების გაციფრებული ვერსიები, ისე საქართველოში გავრცელებული თანამედროვე დიალექტური მეტყველება და ისტორიული დიასპორების ზეპირმეტყველების უნიკალური ნიმუშები.
  5. GEKKO-ს რესურსები (ნორვეგია, ავტორი პაულ მოირერი);
  6. ქართული პრესის ელექტრონული არქივი Opentext (ავტორი ირაკლი იაკობაშვილი) – პირველი პრესის კორპუსი, რომელიც შეიქმნა საქართველოში და აერთიანებს პოსტსაბჭოთა პრესის დიგიტალურ მასალებს.
  7. ღია ელექტრონული რესურსი – ქართული ინტერნეტ-ბიბლიოთეკა lib.ge (ავტორი გიორგი კეკელიძე), თავისუფალი რესურსი, რომელშიც შესულია XIX-XX საუკუნეების ქართული ლიტერატურული და პუბლიცისტური მემკვიდრეობა.