Лексикон-граматика

Лексикон-граматика представља методу и практичан начин формалног описивања језика[1]. За њеног зачетника узима се Морис Грос који је прављењем лексикон-граматике за француски почео да се бави шездесетих година.[2]. Теоријска основа на којој се заснива лексикон-граматика је дистрибуционализам Зелига С. Хариса[3][4], посебно појам трансформације. Ковенције за обележавање граматичких информација направљене су с намером да буду што једноставније и транспарентније. Методологија лексикон-граматике потиче од експерименталних наука[5]. У њима је нагласак стављен на прикупљање чињеница на рачун реалности језичке употребе, и то са квантитативне (систематичан опис лексике)и квалитативне тачке гледишта (методолошке предострожности). Лексикон-граматика поставља и захтев за формализацијом. Резултати описа морају бити довољно формализовани да би лингвисти-информатичари могли да приступе аутоматској обради језика, пре свега помоћу синтаксичких парсера[6][7]. У формалном моделу лексикон-граматике резултати описа су дати у облику табела званих таблице или матрице, у којима се лексичка јединица укршта са синтаксичко-сематичким својствима[8]. Добијени резултати су основа синтаксичко-семантичких информација.

Теоријска основа уреди

Теоријска основа на којој се заснива лексикон-граматика је дистрибуционализам Зелига С. Хариса[3][4], посебно појам трансформације у значењу Зелига Хариса. Морис Грос је био ученик Зелига Хариса. Ковенције за обележавање граматичких информација направљене су с намером да буду што једноставније и што транспарентније. Овај захтев потиче од Зелига Хариса, чија је теорија окренута према непосредном, за разлику од генеративне граматике која се бави апстрактним структурама, као што су дубинска структура и површинска структура[9].

Прикупљање чињеница уреди

Методологија лексикон-граматике потиче од експерименталних наука[5]. Она ставља нагласак на прикупљање чињеница на рачун конкретне језичке употребе, и то са квантитативне и квалитативне тачке гледишта.

Квантитативно : лексикон-граматика подразумева систематичнан опис лексике. Како је ово посао великих размера, остварив само уз помоћ екипа, а не појединачних стручњака. Испитивање искључиво општих правила синтаксе, независно од лексичког материјала на који се примењују, показало се као недовољно добро[10]. У томе лежи разлика у односу на генеративну граматику, која своје тежиште има на општости[9].

Квантитативно : низ методолошких предострожности примењује се како би се обезбедила добра обновљивост запажања, и пре свега како би се спречио ризик од вештачког конструисања примера[11]. Једна од предострожности огледа се у прихватању елементарне реченице као минималне јединице значења[12], будући да реч добија прецизно значење тек у контексту. Штавише, убацивањем речи у реченицу, добија се предност манипулисања низом погодним за оцењивање као прихватљивог или неприхватљивог. По ову цену се синтаксичко-сематничка својства могу сматрати дефинисаним с довољно прецизности, да би имало смисла поредити их са читавим лексиконом. Ове предострожности су се развијале сразмерно потребама и појавом нових техничких средстава. Тако су с почетком деведесетих сарадници на лексикон-граматици могли све лакше да добију помоћ примера потврђених на корпусу[13]. Ова нова предострожност је само додата на претходне, чинећи лексикон-граматику методом која се истовремено и ослања на лингвистичку интроспекцију и лингвистички корпус, као што је предлагао и Чарлс Филмор[14]. Лес пројетс амéрицаинс ФрамеНет[15] ет ВербНет[16] указујући тиме на релативну блискост са циљевима лексикон-граматике.

Формализација уреди

Лексикон-граматика такође поставља и захтев за формализацијом. Резултати описа морају бити довољно формализовани како би омогућили:

Овај захтев за формализацијом манифестује се кроз усвајање посебног информатичког модела синтаксе и семантике. Тако је и прихватљивост моделирана као бинарно својство: за потребе дескрипције, једна реченица може бити сматрана за прихватљиву или неприхватљиву, као и у генеративној граматици и то с истим разлогом. Исто тако, лексичка двосмисленост се представља пажљивим раздвајањем речи од укупног броја лексичких уносака, који се разликују једнако као и два лексичка уноска морфолошки различитих речи (на пример, различита значења речи манqуер имаће различите лексичке уноске). Синтаксичко-семантичка својства лексичких уносака (на пример структуре реченица у којима се дати глагол може појавити, или дистрибуција субјекта) формирају листу која се систематично сучељавају са свим лексичким уносцима. Они су обележени доста неформално облежени као  , што представља трансформацију две реченичне структуре (или синтаксичке конструкције) битне за један лексички уносак. Појам лексичког уноска се на тај начин не меша са појмом синтаксичке конструкције. Зато се и избегава термин "супкатегоризациони оквир", који се често користи у контексту модела по којима су ова два појма у односу бијекције. У оквиру лексикон-граматике одлуке о класификацији ("супкатегоризацији") лексичког уноска базирају се априори на целокупности синтаксичких конструкција формираних од датог лексичког уноска, а не на основу једне конструкције ("оквира"). Најзад, усвајају се само она својства за која је могуће пронаћи процедуру која ће омогућити да се одреди довољно поуздан начин да се одреди да ли је дати лингвистички уносак поседује или не. Таква процедура се одређује експериментално тако што се на проширеном вокабулару тестира обновљивост судова. Својства се тако моделирају бинарно а не као континууми. У складу са овим формалним моделом, суштина описа једног језика састоји се у спецификовању својстава лексичких јединица. Резултати описа тако природно узимају облик табела с дуплим уносом, званих таблице или матрице, у којима се лексички уносци укрштају са синтаксичко-семантичким својствима[8]. Опис структуре реченица ставља у игру идентификацију свих аргумената карактеристичних за сваки од глаголских уносака; пре свега се примењују принципи за разликовање аргумената (субјеката и објеката или допуна) од одредби.

Резултати уреди

Резултати које је десетина лингвиста у току десетак година добила применом наведених методолошких принципа чине базу синтаксичко-семантичких информација за аутоматску обраду језика|. О квалитету ове базе можемо судити узимајући у обзир:

  • њен обим, мерен бројем уносака,
  • богатство језичких феномена које узима у обзир, мерено бројем својстава
  • и њен степен формализације.

За француски језик постоји преко 75.000 уносака[17] ; мање или више исцрпни описи, који увек прате исти модел, постоје и за десетину других језика, при чему су италијански језик, португалски језик, грчки језик и корејски језик најрепрезентативнији[18], ле португалски језик[19], ле грчки језик[20] ет ле корејски језик[тражи се извор].

Рад на предикатским именицама био је завршен и објављен под окриљем лексикон-граматике у току седамдесетих[21], а рад на устаљеним изразима у току осамдесетих[22].

Појам предикатске именице потиче из радова Зелига Хариса[23]. Заснован је на идеји да ако, на пример, глагол проучавати анализирамо као предикат у реченици Лука проучава помрачења Сунца, природно је анализирати именицу проучавање (или ниску вршити проучавање) као предикат у реченици Лука врши проучавање помрачења Сунца. У овом случају, дата именица је изражена предикативно. Глагол који јој претходи, овде вршити квалификује се као глагол подршке. Ова идеја је примењивана систематично у оквиру лексикон-граматике почевши од седамдесетих[21][24][25][26]. Сарадници на лексикон-граматици говоре о устаљеним изразима када израз (на пример стати на луди камен) има специфична својства (овде, своје значење) које оправдава уношење истог као једног од лексичких уносака, иако се састоји из више елемената (стати, на, луди и камен) који, на овај или онај начин, могу бити сматрани речима[22]. Систематичан опис ових израза је започет у оквиру лексикон-граматике од осамдесетих[27][28][29].

Кумулативност уреди

Искуство је показало да неколико појединаца или екипа може доћи до истих резултата. Ова обновљивост осигурава кумулативност описа. Овај резултат је од кључног значаја за аутоматску обраду језика у будућности: количина података који треба да буду сакупљени и представљени у оквиру кохерентног модела је толика да бројне екипе за истраживање и развој морају да сарађују и морају да да споје своје резултате тако да се суштински делови граматике и лексике не морају изнова писати за сваки језик. Овај захтев је још увек далеко од једноставног решења, будући да нема пуно примера граматика значајног обима које нису дело појединачних стручњака.

Референце уреди

  1. ^ (језик: француски)Ибрахим, Амр Хелмy. 2003. Ле цадре ду леxиqуе-граммаире. Линx 48:101-122.
  2. ^ Гросс, Маурице. 1968. Граммаире трансформатионнелле ду франçаис. Вол. 1, Сyнтаxе ду вербе. Парис : Лароуссе (реиздање под истим насловом, Парис: Цантилèне, 1986).
  3. ^ а б (језик: енглески) Харрис, Зеллиг. 1964. "Трансформатионс ин Лингуистиц Струцтуре", Процеедингс оф тхе Америцан Пхилосопхицал Социетy 108:5, пп. 418-122.
  4. ^ а б Харрис, Зеллиг (1976). Нотес ду цоурс де сyнтаxе. Парис: Сеуил. 
  5. ^ а б Ламироy, Бéатрице. 2003. "Ин мемориам Маурице Гросс", Травауx де лингуистиqуе 46:1, пп. 145-158.
  6. ^ а б Мицхел Деламар, Маурице Гросс, http://www.univ-paris-diderot.fr/2001/pres011212.htm Архивирано на сајту Wayback Machine (6. децембар 2006)
  7. ^ а б Роцхе, Еммануел, 1997, "Парсинг wитх Фините-Стате Трансдуцерс", ин Фините-Стате Лангуаге Процессинг, Цамбридге, Масс./ Лондон, МИТ Пресс.
  8. ^ а б Гросс, Маурице. 1975. Мéтходес ен сyнтаxе. Ле рéгиме дес цонструцтионс цомплéтивес. Парис : Херманн.
  9. ^ а б Сyнтацтиц Струцтурес - Ноам Цхомскy, Давид W. Лигхтфоот - Гоогле Књиге
  10. ^ (језик: енглески) Гросс, Маурице. 1979. Он тхе фаилуре оф генеративе граммар. Лангуаге 55:4, пп. 859-885.
  11. ^ Гросс, Маурице, А лингуистиц енвиронмент фор цомпаративе Романце сyнтаx, Паперс фром тхе XИИтх Лингуистиц Сyмпосиум он Романце Лангуагес, 1984, пп. 373-446, Амстердам/Пхиладелпхиа: Јохн Бењаминс.
  12. ^ Гросс, Маурице. 1988. Метходс анд Тацтицс ин тхе Цонструцтион оф а Леxицон-Граммар. Ин Лингуистицс ин тхе Морнинг Цалм 2, Селецтед Паперс фром СИЦОЛ 1986, пп. 177-197, Сéоул : Хансхин Пуб. Цо.
  13. ^ Пре свега захваљујући софтверу Интеx који је развио Макс Силберштајн.
  14. ^ (језик: енглески) Филлморе, Цхарлес. 1992. "'Цорпус лингуистицс' вс. 'Цомпутер-аидед армцхаир лингуистицс'". Дирецтионс ин Цорпус Лингуистицс, Моутон де Груyтер, пп. 35-60. (Процеедингс фром а 1992 Нобел Сyмпосиум он Цорпус Лингуистицс, Стоцкхолм.)
  15. ^ (језик: енглески) Бакер, Цоллин Ф., Цхарлес Ј. Филлморе, Беау Цронин. 2003. "Тхе Струцтуре оф тхе Фраменет Датабасе", Интернатионал Јоурнал оф Леxицограпхy 16.3, пп. 281-296.
  16. ^ (језик: енглески) Киппер-Сцхулер, Карин, Анна Корхонен, Невилле Рyант, Мартха Палмер. 2006. "Еxтендинг ВербНет wитх Новел Верб Цлассес". Процеедингс оф тхе Интернатионал Цонференце он Лангуаге Ресоурцес анд Евалуатион (ЛРЕЦ), Геноа.[мртва веза]
  17. ^ Гросс, Маурице. 2006. Éтат ду леxиqуе-граммаире ду франçаис ет перспецтивес д'еxтенсион. Хисторy оф тхе Лангуаге Сциенцес, томе 3, Сyлваин Ауроуx ет ал. (едс.), Берлин-Неw Yорк: Wалтер де Груyтер, пп. 2122-2129.
  18. ^ (језик: енглески) D'Агостино, Емилио, Аннибале Елиа, & Симонетта Виетри. 2004. "Леxицон-Граммар, Елецтрониц Дицтионариес анд Лоцал Граммарс оф Италиан", Леxиqуе, сyнтаxе ет леxиqуе-граммаире. Паперс ин хоноур оф Маурице Гросс, Цолл. Лингвистицае Инвестигатионес Супплемента, 24, Амстердам/Пхиладелпхиа : Бењаминс, пп. 125–136.
  19. ^ (језик: енглески) Ранцхход, Елисабете; П. Царвалхо; C. Мота; А. Барреиро, "Португуесе Ларге-сцале Лангуаге Ресоурцес фор НЛП Апплицатионс". Ин Процеедингс оф тхе 4тх ЛРЕЦ, пп. 1755-1758, Лисбон.
  20. ^ Кyриацопоулоу, Тита. 2004. Аналyсе аутоматиqуе дес теxтес éцритс : ле цас ду грец модерне. Тхессалоники : Университy Пресс.
  21. ^ а б Лабелле, Јацqуес. 1974. "Ле субстантиф сyмéтриqуе". Цахиерс де Лингуистиqуе 5, пп. 17-49, Монтрéал: УQАМ.
  22. ^ а б Гросс, Маурице. 1982. Уне цлассифицатион дес пхрасес "фигéес" ду франçаис. Ревуе Qуéбéцоисе де Лингуистиqуе 11.2, пп. 151-185, Монтрéал: УQАМ.
  23. ^ (језик: енглески) Харрис, Зеллиг, 1964. "Тхе Елементарy трансформатионс", Трансформатионс анд Дисцоурсе Аналyсис Паперс, 54, Пхиладелпхие, Университé де Пеннсyлвание (републиé данс Паперс ин Струцтурал анд Трансформатионал Лингуистицс, 1970, Дордрецхт:Реидел).
  24. ^ Гирy-Сцхнеидер, Јацqуелине. 1978. Лес номиналисатионс ен франçаис. L'опéратеур фаире данс ле леxиqуе. Генèве: Дроз.
  25. ^ Гирy-Сцхнеидер, Јацqуелине. 1987. Лес прéдицатс номинауx ен франçаис. Лес пхрасес симплес à вербе суппорт. Генèве: Дроз.
  26. ^ Гросс, Гастон. 1989. Лес цонструцтионс цонверсес ду франçаис, Генèве : Дроз.
  27. ^ Данлос, Лауренце. 1981. Ла морпхосyнтаxе дес еxпрессионс фигéес. Лангагес 63, пп. 53-74, Парис : Лароуссе. пдф Архивирано на сајту Wayback Machine (24. септембар 2015)
  28. ^ (језик: енглески) Гросс, Маурице. 1986. "Леxицон-Граммар. Тхе Репресентатион оф Цомпоунд Wордс". Ин ЦОЛИНГ-1986 Процеедингс, Бонн, пп. 1-6. пдф
  29. ^ (језик: португалски) Ранцхход, Елисабете. 1990. Синтаxе дос Предицадос Номинаис цом Естар. Лингуистица 1-2, Лисбоа: Институто Национал де Инвестигаçао Циентифица.

Литература уреди

Види још уреди

Повезани чланци уреди

Спољашње везе уреди

Библиографија уреди

  • Боонс, Јеан-Паул ; Алаин Гуиллет ; Цхристиан Лецлèре. 1976. Ла струцтуре дес пхрасес симплес ен франçаис. Цонструцтионс интранситивес, Генèве : Дроз.(језик: француски)
  • Гуиллет, Алаин ; Цхристиан Лецлèре. 1992. Ла струцтуре дес пхрасес симплес ен франçаис. Цонструцтионс транситивес лоцативес, Генèве : Дроз.(језик: француски)
  • Гросс, Маурице. 1994. Цонструцтинг Леxицон-граммарс, ин Цомпутатионал Аппроацхес то тхе Леxицон, Аткинс анд Замполли (едс.), Оxфорд Университy Пресс, пп. 213-263.(језик: француски)