Page 1 sur 1

An Drouizig Difazier 2.0 (diell)

Publié : lun. oct. 24, 2005 1:08 pm
par drouizig
drouizig a écrit :[erruet eo kozhik ar pennad-mañ, lakaet amañ evit diellañ]
La nouvelle version du correcteur orthographique et syntaxique de langue bretonne, pour Microsoft Office 2000/2002/XP/2003, est aujourd'hui disponible. La version actuelle devrait rester en beta pendant deux mois. La version 2.0 définitive, qui restera gratuite, proposera une correction aux formes syntaxiques incorrectes détectées.

Le correcteur orthographique reconnaît à présent 870000 formes du breton unifié, soit une base de 50000 mots principaux. Un moteur de césure automatique, qui permet le découpage assisté des mots en fin de ligne est aussi présent depuis la version 1.2.1.
La principale innovation de la version 2.0 est la présence d'un analyseur grammatical dont la première finalité est la détection des erreurs de syntaxe élémentaires, principalement les fautes de mutation. Il sait détecter également la présence d'un mauvais article ou pronom, d'un genre ou d'un nombre incorrect, ou encore d'une mauvaise préposition (« da » pour l'instant).
La majorité des règles de mutation sont prises en compte par le logiciel, les références étant « Grammaire bretonne » de Roparz Hemon, « Yezhadur Bras Ar Brezhoneg » de Fañch Kervella et dans une moindre mesure « Yezhadur Ar Brezhoneg a-vremañ » de Francis Favereau.

Quelques règles ne sont toutefois pas traitées comme la mutation de «mad/man » avec le verbe « ober », la mutation de « piv » ou du nom après « Ki » et « Ti » (dans « Ti biv ? Ti Gergelenn », cf. Kervella), ou la mutation du nom servant de qualificatif (comme dans « Tud Vreizh » ou « An delenn goad »).

Le test poussé du correcteur syntaxique sur plus d'un millier de pages d'un bon niveau de breton, atteste qu'il permet dès à présent la détection de nombreuses erreurs.

Néanmoins, l'absence de traitement pour les cas d'ambiguïté syntaxique, dont le nombre est évidemment non négligeable pour une langue vivante telle que le breton, demeure un obstacle à franchir avant d'en faire un outil de grande fiabilité. Et la majorité des cas d'ambiguïté ne pourront pas être résolus sans une prise en compte du contexte et de la sémantique, ce qui n'est ni prévu, ni décemment envisageable à l'échelle d'un projet comme « An Drouizig ».

Le correcteur pourra donc rester muet en présence de certaines formes incorrectes. Parmi les raisons invoquées : de nombreux noms ont un genre mixte en breton, ou une forme mutée peut correspondre à la base d'un autre mot (du/tu, don/ton, koazh/c'hoazh, koar/goar/c'hoar, ...). Prudence donc .

La principale lacune restera indubitablement le traitement du cas « e + nom » qui peut entraîner une mutation par adoucissement si « e » est le pronom possessif « son/sa/ses », ou pas de mutation, dans le cas de la préposition « en/dans ». Après une longue réflexion, il apparaît qu'il n'y a malheureusement pas de solution simple de distinguer la bonne règle de mutation à appliquer. Pas de solution fiable, ne faisant pas intervenir une prise en charge du contexte et de la sémantique. Là encore prudence.

En revanche, tous les cas d'exception répertoriés (ar plac'h, an tadoù gwirion, ur gavotenn, ur revr vras...) sont bien traités par le correcteur.

Téléchargement libre sur http://www.drouizig.org

Le bureau de l'association K.A.D. - Korvigelloù an Drouizig.