შესავალი
კორპუსის ცნება თანამედროვე ჰუმანიტარულ დარგებში a priori ასოცირდება მონაცემთა დიგიტალურ ფორმასთან. თანამედროვე კორპუსები შედგება ახალი ტიპის რესურსებისაგან, ანუ რესურსებისაგან, რომლებიც ელექტრონულ მატარებლებზე არის გადატანილი და ელექტრონულ დამუშავებას ექვემდებარება. აქედან გამომდინარე, ცნება „კორპუსი“ ავტომატურად მოიცავს მსაზღვრელს „ელექტრონული“. შესაბამისად, კორპუსის ცნება დღეისათვის უტოლდება ცნებას „ელექტრონული კორპუსი“ (ალტერნატივა: დიგიტალური კორპუსი).
მიუხედავად იმისა, რომ კორპუსის ცნება იმ გაგებით, რა გაგებითაც იგი კორპუსლინგვისტიკაში გამოიყენება, მე-20 საუკუნის სამეცნიერო ტერმინი გახლავთ, შესაძლებლად მიგვაჩნია მისი მეტაფორული გამოყენება ქაღალდზე დოკუმენტირებული ტექსტური რესურსების აღსანიშნავადაც. თუ კორპუსი დღევანდელი გაგებით ელექტრონულად დოკუმენტირებულ რესურსთა ნაკრებს წარმოადგენს, მაშინ ქაღალდზე დოკუმენტირებულ რესურსთა მიზნობრივ ნაკრებს შეგვიძლია მეტაფორულად „ქაღალდის კორპუსი“ ვუწოდოთ.
კავკასიური ენების კვლევისა და დოკუმენტირების ადრინდელი საფეხური შეიძლება განვიხილოთ, როგორც ქაღალდის კორპუსის ეპოქა. XVII, XIX და XX საუკუნის პირველ ნახევარში ენობრივი მასალების დოკუმენტირება, მაგნიტური მატარებლების არარსებობის გამო, არსებითად პირდაპირ ქაღალდზე ხდებოდა. ასე შეიქმნა ევლია ჩელების, ანტონ გიულდენშტედტის, იულიუს პალასის და სხვათა მიერ დოკუმენტირებული ენობრივი რესურსები. ქაღალდის კორპუსის მაგალითად შეიძლება ჩაითვალოს მე-20 საუკუნის 30-იან წლებში შექმნილი დიალექტური მასალების უნიკალური კოლექცია, რომელიც ივ. ჯავახიშვილის თაოსნობით მოწყობილი ისტორიული ექსპედიციის მიერ იქნა შეგროვებული და მიზნად ისახავდა საქართველოს ყველა კუთხის მეტყველების დოკუმენტირებას.
ელექტრონული კორპუსების ერა გასული საუკუნის 60-იანი წლებიდან იწყება. ნელსონ ფრენსისისა (Nelson Francis) და ჰენრი კუჩერას (Henry Kučera) ავტორობით 1967 წელს გამოქვეყნებული სტატია „Computational Analysis of Present-Day American English“, რომელმაც საბოლოოდ შეცვალა ლინგვისტური პარადიგმა, ეყრდნობოდა მათ მიერვე ინიცირებულ და განხორციელებულ ამერიკული ინგლისური ენის მონაცემთა ელექტრონულ ბაზას და ერთგვარ საპროგრამო დოკუმენტად იქცა კორპუსლინგვისტიკაში.
ამერიკული ინგლისური ენის მონაცემთა ელექტრონულ ბაზის პირველი ვერსია 1960 წელს შეიქმნა, თუმცა კორპუსის საბოლოო დიზაინის პრინციპები საჯარო დისკუსიის საგნად Brown-ის უნივერსიტეტში 1963 წლის თებერვალს გამართულ კონფერენციაზე აქციეს ნ. ფრენსისმა და ჰ. კუჩერამ. აქვე შეჯერდა ექსპლიკატების საბოლოო ეტიკეტები და ისიც, რომ ტექსტები არა მარტო ჟანრულად, არამედ ქრონოლოგიურადაც შეზღუდულიყო. სწორედ ამიტომ ააერთიანებს ბრაუნის კორპუსი ერთი წლის მანძილზე (1961) ამერიკაში გამოცემულ ტექსტურ პროდუქციას.
ბრაუნის კორპუსი, მიუხედავად მისი – დღევანდელი გადასახედიდან – მცირე მოცულობისა (1 მილიონი ტოკენი), უკვე შექმნის დროიდანვე ახერხებდა ყველა ფუნდამენტური კორპუსული ფუნქციის შესრულებას, სიტყვათა სიხშირის ასახვიდან დაწყებული ჰიპოთეზების სტატისტიკური შემოწმებით დამთავრებული.
თუ გავითვალისწინებთ იმ გარემოებას, რომ ბრაუნის კორპუსის შექმნის ფაზების უდიდესი ნაწილი არა ავტომატურ რეჟიმში, არამედ მანუალურად ხორციელდებოდა, ნათელი გახდება შესრულებული სამუშაოს კოლოსალური მასშტაბი. ენობრივი მონაცემების ასახვის ბალანსმა ბრაუნის კორპუსში, და ამ მონაცემების შემოფარგვლამ ამერიკული ინგლისურის მოხმარების ერთწლიან ფარგლებში, პირველად დააფუძნა კორპუსლინგვისტური წარმოდგენა ე. წ. „ოქროს სტანდარტის“ შესახებ, რომლისგანაც ბრაუნის კორპუსი, მართალია, პრაქტიკულად ჯერ კიდევ შორს იყო, თუმცა ცალსახად ასახა ამგვარი სტანდარტის მიღწევის გზა კორპუსლინგვისტიკაში.
კორპუსის სახეები
კორპუსის სტრუქტურისა და კორპუსის გამოყენების მიზნებიდან გამომდინარე, განასხვავებენ კორპუსის სხვადასხვა სახეს: ა) რეფერენციული კორპუსი, ბ) სტატიკური კორპუსი, გ) მონიტორული კორპუსი, დ) ანოტირებული კორპუსი, ე) ერთენოვანი (მონოლინგვური) კორპუსი, ვ) მრავალენოვანი (მულტილინგვური) კორპუსი, ზ) პარალელური კორპუსი, თ) სპეციალური ანუ თემატური კორპუსი. განვიხილოთ თითოეული თემატური კროპუსი ცალ-ცალკე.
ა) რეფერენციული კორპუსი
რეფერენციული კორპუსი არის კორპუსის სახე, რომელიც მასში თავმოყრილი მასალების რეფერენციულობის მაღალი ხარისხით ხასიათდება. რეფერენციული კორპუსები, როგორც წესი, მიემართება უკვე არსებულ სხვადასხვა კორპუსებს. რეფერენციული კორპუსის მაგალითად შეიძლება განვიხილოთ გერმანული ენის რეფერენციული კორპუსი DeReKo (Das Deutsche Referenzkorpus).
DeReKo-ს შექმნა დაიწყო გასული საუკუნის 60-იანი წლებში მანჰაიმის გერმანული ენის ინსტიტუტში და დღესდღეობით გერმანული ენისათვის არსებულ ყველაზე რეპრეზენტაციულ კორპუსს წარმოადგენს. მისი მოცულობა 1992 წლიდან (28 მილიონი ტოკენი) 2014 წლამდე საგრძნობლად გაიზარდა (24 მილიარდი ტოკენი). ქვემოთ მოყვანილ ცხრილში კარგად ჩანს DeReKo-ს მოცულობის ზრდის დინამიკა.
გერმანულ რეფერენციულ კორპუსში განთავსებული რესურსები საკმაოდ მრავალფეროვანია – გარდა მე-20 და 21-ე საუკუნეების ბელეტრისტიკისა, იგი მოიცავს სამეცნიერო, სამეცნიერო-პოპულარულ, დარგობრივ ლიტერატურას, ასევე პრესის მასალებს და სხვადასხვა თემატურ და ფრაგმენტულ კორპუსებს, როგორიცაა ბონის საგაზეთო კორპუსი (Bonner Zeitungskorpus), გოეთეს კორპუსი (Goete-korpus), გრამატიკის კორპუსი (Grammatik-korpus), გრიმის კორპუსი (Grimm-korpus), მარქსისა და ენგელსის კორპუსები (Marx-Engels-korpora), პოლიტიკური გამოსვლების გერმანული კორპუსი ვიზუალიზაციის თანხლებით, საპარლამენტო პლენარული სხდომების პროტოკოლების კორპუსი (Plenarprotokolle), ე.წ. „პოლიტიკური შემობრუნების“ კორპუსი (Wendekorpus), ინტერვიუების კორპუსი, ისტორიული კორპუსი და სხვა.
რეფერენციული კორპუსის მეორე მაგალითად შეიძლება დავასახელოთ კორპუსი C4 (Corpus C4), რომელიც მიემართება ოთხი კორპუსის მონაცემებს: მე-20-ე საუკუნის გერმანული ენის დიგიტალურ ლექსიკონს (DWDS), ავსტრიის აკადემიურ კორპუსს (AAC), შვეიცარიული ტექსტების კორპუსს (CHTK) და სამხრეთ ტიროლის კორპუსს.
რაც შეეხება ქართული ენის რეფერენციულ კორპუსს, მის შესახებ საგანგებოდ არის მსჯელობა ამავე პორტალის სხვა განყოფილებაში, კერძოდ, დიგიტალური ჰუმანიტარიის ერთ-ერთ ქვეთავში.
ბ) სტატიკური კორპუსი
კორპუსების შექმნა მეცნიერთა და ტექნიკური პერსონალის მხრიდან მრავალწლიან მუშაობას მოითხოვს. კორპუსის შექმნის პირველსავე ეტაპზე განისაზღვრება კორპუსის სახე და ტიპი და დგინდება კორპუსში შემავალი რესურსების (სავარაუდო ან სასურველი) მოცულობა. რესურსების მოცულობა შეიძლება საზღვრული იყოს, რესურსების ბუნებიდან ან ობიექტური მოცემულობიდან გამომდინარე. მაგ., თუ საქართველოს ტერიტორიაზე დაცული ქართული ეპიგრაფიკის კორპუსის შექმნას გადავწყვეტთ, მაშინ კორპუსის რესურსად მოიაზრება ყველა ეპიგრაფიკული წარწერა, რომელიც უკვე დოკუმენტირებულია და ასახულია სამეცნიერო ლიტერატურაში, არქიტექტურული ძეგლების ორგანულ ნაწილს წარმოადგენს ან დაცულია მუზეუმებში. თუმცა უნდა გავითვალისწინოთ, რომ წარწერების გარკვეული ნაწილი საქართველოს მთელ ტერიტორიაზეა გაბნეული, ჯერ კიდევ არ არის აღრიცხული, შესწავლილი და გამოქვეყნებული. თუ მოვახერხებთ ქართული წარწერების დამუშავებული და დაუმუშავებელი რესურსების თავმოყრას და ქართული ეპიგრაფიკის კორპუსის შექმნას, ასეთ შემთხვევაში ჩვენ შევქმნით სტატიკურ კორპუსს, ანუ კორპუსს, რომელიც თვისებრივად და რაოდენობრივად (მასში შესული მასალების თვალსაზრისით) აღარ შეიცვლება. კორპუსი სტატიკურ მდგომარეობაში გადადის, ანუ აღარ მიმდინარეობს მისი მონიტორინგი – თვისობრივი „შევსება“ და კორპუსის მასალობრივი განვრცობა. და რაც მთავარია, უცვლელი რჩება კორპუსის მენეჯერი – კორპუსის შიდა სტრუქტურა და საძიებო სისტემა.
სტატიკური კორპუსის მაგალითი შეიძლება იყოს რომელიმე მწერლის ლიტერატურული მემკვიდრეობის კორპუსი, მაგალითად, ილია ჭავჭავაძის ლიტერატურული კორპუსი. ასეთი კორპუსის შემთხვევაში საქმე გვაქვს კორპუსისათვის რელევანტური რესურსების სასრულობასთან: თუ ჩვენ ილია ჭავჭავაძის ყველა ლიტერატურულ ნაშრომს შევიტანთ კორპუსში, მაშინ ილია ჭავჭავაძის ლიტერატურული კორპუსი რესურსების თვალსაზრისით „დაიხურება“ და აღარ განივრცობა.
სტატიკური კორპუსის არსებობა შეიძლება განპირობებული იყოს ორი ფაქტორით: კორპუსის რესურსების სასრულობით ან კორპუსის განვითარების პერსპექტივის უქონლობით. თუმცა, შესაძლებელია, მასალების სისრულეს მივაღწიოთ და მაქსიმალურად ამოვწუროთ რესურსების ასახვის შესაძლებლობა კორპუსში, მაგრამ კორპუსის განვითარება ამით არ დამთავრდეს – ტექნოლოგიური საშუალებების განვითარების შესაბამისად მოხდეს კორპუსის მუდმივი ტექნოლოგიური განახლება (update). ასეთ შემთხვევაში საქმე გვაქვს კორპუსის სხვა სახესთან, რომელსაც მონიტორული კორპუსი ეწოდება.
გ) მონიტორული კორპუსი
მონიტორული კორპუსი არის კორპუსის ისეთი სახე, რომელშიც მონაცემთა შეტანა პერიოდულად ახლდება, იცვლება სტრუქტურა და მოხმარების ინტერფეისი. მონიტორული კორპუსის მაგალითად გამოდგება მანჰაიმის საგაზეთო კორპუსი „Mannheimer Morgen“. კორპუსის ის ნაწილი, რომელიც 1997 წლამდე გამოცემულ მასალებს ასახავს, ხშირად ფრაგმენტულია და არათანმიმდევრული, რაც იმით არის განპირობებული, რომ იმ პერიოდში აღნიშნული გაზეთი მხოლოდ ბეჭდური სახით გამოდიოდა და მისი სრული გაციფრება დღეისათვის დიდ დროს და სახსრებს მოითხოვს. ამჟამად მიმდინარეობს არასრულად ასახული პერიოდების სისტემატური შევსება ნაკლული რესურსებით. მანჰაიმის საგაზეთო კორპუსი, აქედან გამომდინარე, მონიტორული კორპუსია, ვინაიდან მუდმივად მიმდინარეობს მისი მონიტორინგი კორპუსში რესურსების სისრულის მისაღწევად.
მანჰაიმის საგაზეთო კორპუსის მონიტორინგი თვალსაჩინოდაა ნაჩვენები ქვემოთ მოცემულ ცხრილში.
დ) პარალელური კორპუსი
კორპუსების უმრავლესობა მონოლინგვურ კორპუსს წარმოადგენს. ამგვარი კორპუსების რესურსები მხოლოდ ერთი ენის მონაცემებს შეიცავს. თუმცა კომპარატივისტიკის დარგის მოთხოვნილებისა და შედარებითი ენათმეცნიერებისა თუ ლიტერატურათმცოდნეობის გავლენით, ასევე მთარგმნელობითი კვლევის ასპექტებიდან გამომდინარე, სულ უფრო გახშირდა ე.წ. პარალელური კორპუსების შექმნის შემთხვევები.
პარალელური კორპუსი შეიძლება იყოს ერთენოვანი (ერთენოვანი პარალელური კორპუსი), ორენოვანი (ორენოვანი პარალელური კორპუსი) ან რამდენიმეენოვანი (მრავალენოვანი პარალელური კორპუსი). ერთენოვანი პარალელური კორპუსი იქმნება ერთი და იმავე ტექსტის ერთ ენაზე არსებული სხვადასხვა ვერსიების შეპირისპირებისა და დაპარალელების საფუძველზე. ერთენოვანი კორპუსები ძირითადად ისტორიულ ან ლიტერატურულ ძეგლთა ხელნაწერების ვარიანტებისაგან იქმნება. ამგვარი კორპუსები შეიძლება შეიქმნას ლიტერატურული, რელიგიური ან ისტორიული ძეგლებისათვის, როგორიცაა, მაგალითად:
- ქართული სახარების პარალელური კორპუსი, რომელიც მოიცავს სახარების არსებული რედაქციების ბაზაზე შექმნილ რელევანტურ ხელნაწერთა დაპარალელებულ ვერსიას;
- ქართლის ცხოვრების პარალელური კორპუსი, რომელიც მოიცავს ამ ისტორიული ძეგლის ხელნაწერთა დაპარალელებულ ვერსიას;
- ვეფხისტყაოსნის პარალელური კორპუსი, რომელიც მოიცავს ქართული ლიტერატურის ამ უმნიშვნელოვანესი ძეგლის სხვადასხვა რედაქციებისა (ხელნაწერების მიხედვით) და სხვადასხვა ენებზე არსებული თარგმანების შეპირისპირებას ქართულ ორიგინალთან.
პირველ ორ შემთხვევაში საქმე გვაქვს ერთენოვან პარალელურ კორპუსთან, მესამე შემთხვევაში კი – მრავალენოვან პარალელურ კორპუსთან.
მონოლინგვური პარალელური კორპუსების შექმნა განპირობებულია ისტორიული ძეგლების ლინგვისტური და კომპარატივისტული, ისევე როგორც ტექსტოლოგიური კვლევის ამოცანებიდან გამომდინარე. საბეჭდი საშუალებების შექმნამდე და ქართული ნაბეჭდი წიგნების გამოცემამდე ქართული საეკლესიო და საერო ლიტერატურა ხელნაწერი წიგნების სახით ვრცელდებოდა, რომელშიც შესაბამისად აისახა გადაწერის ეპოქაში მიმდინარე ენობრივი ცვლილებები. შესაბამისად, ჩვენამდე მოღწეული სხვადასხვა საუკუნეში გადაწერილი ხელნაწერები ერთმანეთისაგან განსხვავდებიან ენობრივად. იმის საკვლევად, თუ რომელი ხელნაწერი უნდა მივიჩნიოთ საბაზისო ხელნაწერად და რომელი მათგანი გადაწერილად, ხოლო დაუთარიღებელი ხელნაწერების შემთხვევაში სისტემურად ვიკვლიოთ, რომელი ხელნაწერია უფრო ძველი, ფასდაუდებელია პარალელური კორპუსების არსებობა და გამოყენება.
პარალელური კორპუსის მაგალითია ფრანკფურტის უნივერსიტეტში განხორციელებული პროექტის LOEWE (Landes-Offensive zur Entwicklung wissenschaftlich ökonomischer Exzellenz) ფარგლებში შექმნილი ქართული ოთხთავის პარალელური კორპუსი, რომელიც სახარების ტექსტის სხვადასხვა რედაქციების პარალელურ ვერსიებს შეიცავს, და დამატებით მიემართება ბერძნულ და სომხურ შესაბამის წყაროებსაც.
ე) სპეციალური ანუ თემატური კორპუსი
სპეციალურ ან თემატურ კორპუსებად მიჩნეულია ისეთი კორპუსები, რომელიც ენობრივ რესურსებს აერთიანებს გარკვეული სპეციალური თემატიკის მიხედვით. თემატური კორპუსია მაგალითად, დეფექტური მეტყველების კორპუსი (Fromkin’s Speech Error Database), ბავშვთა მეტყველების კორპუსი (Child Language Data Exchange System), ბონის პრესის კორპუსი (Bonner Zeitungs-Korpus), დორტმუნდის ჩატის კორპუსი და სხვ. მაგალითისათვის განვიხილოთ ალპინისტური კორპუსი – Corpus: Text+Berg digital.
თემატური კორპუსი Text+Berg digital (ე.წ. ალპინისტური კორპუსი) შეიქმნა დრეზდენის ტექნიკურ უნივერსიტეტში დოქტ. ნოა ბუბენჰოფერის (Noah Bubenhofer) და ციურიხის უნივერსიტეტის პროფ. მარტინ ფოლკის (Martin Volk) მიერ სამეცნიერო პროექტის ფარგლებში და მიზნად ისახავდა ალპინისტური ლიტერატურის დიგიტალიზაციას თემატური კორპუსის შექმნის მიზნით. კორპუსში შევიდა შვეიცარიის ალპური კლუბების წლიური ანგარიშების ბეჭდური რესურსები – 1864-1923 წლებში ყოველწლიური გამოცემები, 1923 წლიდან კი ყოველთვიური ჟურნალი „ალპები“.
ალპინისტური კორპუსის, როგორც თემატური კორპუსის შექმნა, გარდა ისტორიული ფაქტების კვლევისა, ლინგვისტური თვალსაზრისითაც იყო მნიშვნელოვანი. აქ მოვიტანთ რამდენიმე საინტერესო დაკვირვებას კორპუსპრაგმატული თვალსაზრისით:
- ადრეულ ტექსტებში ჭარბობს ნარატიული თხრობა, წინადადებები გრძელია. გვიანდელ ტექსტებში წინადადებები მოკლდება, სამაგიეროდ მატულობს პასიური კონსტრუქციები და ნარატიული თხრობა იცვლება ექსპრესიული თხრობით, რომელიც ძირითადად გადმოცემულია პირველ პირში (საზომი ინდიცი: პასიური კონსტრუქციების, ექსპრესიულობის გამომხატველი ლექსიკური და ფუნქციური ელემენტების პოვნიერება).
- ტექსტის შეფასების ერთ-ერთ პარამეტრს წარმოადგენს „ტექსტის ლექსიკური სიმდიდრის“ პარამეტრი, რომელიც იზომება ტექსტში ლექსემების რაოდენობის მიხედვით: რაც უფრო ხშირად გვხვდება ერთი და იგივე სიტყვა ტექსტში, მით უფრო დაბალია აღნიშნული პარამეტრი და შესაბამისად, ტექსტი – უფრო პრიმიტიული და მარტივად გასაგები. როგორც კორპუსის ავტორის, ნოა ბუბენჰოფერის კვლევის შედეგებიდან ჩანს, ლექსიკური სიმდიდრის პარამეტრთან ერთად წინადადების სიგრძე და ტექსტის სირთულე საგრძნობლად ეცემა 1864-1960 წლებში, 1960 წლიდან კი ისევ მატულობს.
- ადრეულ ტექსტებში ლექსემებიდან დომინირებენ ნაცვალსახელები ჩვენ, ჩვენი, არსებითი სახელებიდან მეგობარი, თანაგუნდელი, ფოტო. ხოლო ზმნიზედებიდან აქ, ახლა, ასევე ნაწილაკი დიახაც.
- შედარებით თანამედროვე ტექსტებში ჭარბობენ ლექსემები ტელეფონი, ფოტო, მარშრუტი, პარასკევი, ინფორმაცია, სტატია, თუმცა, სპორტის სახეობები, რომელიც გვიანდელ ტექსტებში დასტურდება, გაცილებით მრავალფეროვანია.
- ადრეულ ტექსტებში პირის ნაცვალსახელები იშვიათად გვხვდება, მათ ადგილს ანთროპონიმები ან სპეციფიური ლექსიკა (მეგობარი, თანაგუნდელი) იკავებს. გვიანდელ ტექსტებში იგივე სურათი გვაქვს, რაც ალპინისტების გუნდურობისა და სოციალიზაციის ძირითად მახასიათებელ ნიშნად რჩება.
- გვიანდელი ტექსტების ლექსიკურ მარაგში აღარ გვხვდება განცდისმიერი ლექსიკა, რომანტიკული, სენტიმენტალური, ექსპრესიული შინაარსის გადმომცემი სიტყვები, რაც ამ პერიოდის ალპინისტებში სამყაროს არარომანტიკული აღქმის დამადასტურებელია. ადრინდელ ტექსტებში „ემოციურობის“ კოეფიციენტის გაზომვა, გარდა ლექსიკური საზომისა (შესაბამისი ლექსემების პოვნიერება, როგორიცაა მშვენიერი, განსაცვიფრებელი, შთამბეჭდავი), კომპლექსური n-gramm-ების მეშვეობითაც დასტურდება. მაგ.: ელიპტური ძახილის წინადადებები ADJ+NN+! (Ein wunderbarer Tag! „მშვენიერი დღე!“). ქართულში ამ ტიპის ელიფსურ წინადადებებს შეესაბამება არაელიფსური წინადადებები კოპულით: „(რა) მშვენიერი დღეა!“. გვიანდელი ტექსტების ენა რეპორტაჟული ტიპისაა და აღარ არის დაშტამპული პიროვნული შთაბეჭდილებებით, მოზომილი და რაციონალურია.
როგორც ალპინისტური კორპუსის კვლევები გვიჩვენებს, საუკუნე-ნახევრის განმავლობაში საგრძნობლად შეიცვალა მთამსვლელთა მოტივაცია: თუ მე-18 საუკუნის მეორე ნახევარში მთამსვლელთა ალპებში მოგზაურობის ძირითადი მიზანი სამეცნიერო-შემეცნებითი იყო, მე-20 საუკუნის 30-იან წლებში წინა პლანზე ჩანს არა ბუნება მთელი თავისი მრავალფეროვნებით, არამედ თავად ადამიანი – ერთი მხრივ Ego-ს და მეორე მხრივ, ტექნოკრატიული მსოფლიოს სურათი გაცილებით ძლიერდება თანამედროვე ალპინისტურ ლიტერატურაში.
კორპუსში აღნიშნული კვლევის განხორციელება შესაძლებელი გახდა იმდენად, რამდენადაც კორპუსი სრულად არის ანოტირებული. კორპუსის მოცულობა შეადგენს 37 მილიონამდე ტოკენს.