Te ivez difenn ar brezhoneg gant Broudix, « An Drouizig » !

Degemer

Brezhoneg 
Saozneg 
Galleg 

Ar foromoù

Daveoù

Skrivit deomp ! 


Liens utiles:

Le dictionnaire électronique

Sur quelle norme écrite se base « An Drouizig Difazier » ?

Le dictionnaire se compose exclusivement de mots orthographiés selon la norme unifiée, dénommée aussi parfois « Breton KLTG » ou encore en breton, Brezhoneg peurunvan (= Breton « tout à fait » unifié).

Cette norme se distingue par l'utilisation fréquente du « zh ». Par exemple, on écrit « Breizh », forme unifiée de « Breiz » (KLT) et « Breih » (Gw). Deux autres exemples, on écrit la graphie « evit » quand d'autres écriraient « ewid » ou « evid », on écrit « enderv » quand d'autres écriraient « enderw » ou « endero ». Ce « v » terminal qui surprendra plus d'un bretonnant, aussi bien néo que de naissance, est une proposition de Xavier de Langlais pour prendre en compte le dialecte du Goëlo (Plouha, Paimpol) dont les locuteurs prononcent « enderff, glaff, piff ... » quand la majorité des bretonnants prononceront « enderow, glaow, piouw ... »

Cette norme se caractérise aussi par l'utilisation du « ñ » terminal aux infinitifs de verbes « kanañ », « prientiñ » ... et aux superlatifs « brasañ », « bihanañ » ...

Certaines formes dialectales assez fréquentes comme àr, teus, meump, … pourront être incluses dans le dictionnaire.

L'alphabet breton unifié.

Les lettres de l'alphabet breton unifié sont les suivantes :

a b ch c'h d e f g h i j k l m n o p r s t u v w y z.

Notez qu'il n'y a pas de c (autre que dans les polygraphes ch et c'h) , ni de q, ni de x. Pour des raisons évidentes, les lettres c, q et x ne seront pas gérées comme des lettres allogènes et ainsi ne se comporteront pas comme des séparateurs de mots. En revanche, vous pouvez être certain qu’un mot incluant une de ces lettres sera étranger au dictionnaire.

Lettres accentuées.

Les quatre lettres de l'alphabet breton unifié pouvant être accentuées sont traditionnellement les suivantes :

ù ñ ü ê

On trouvera cependant les trois â û ô dans les seuls mots kornôg, skuizh-ôg, lârout (lâr-) et goût. Enfin, les deux à é peuvent se rencontrer accessoirement sur des formes dialectales vannetaises.

Exemples de mots bretons composés de lettres accentuées :

lâr ; kêrioù ; àr ; brasañ ; é ; kornôg ; skuizh-ôg ; û ; emroüs ; goût

Tout mot incorrectement accentué sera marqué par le correcteur. Attention, certains caractères accentués exotiques (õ, ø, ó, ã, å, …) peuvent agir comme séparateur de mot.

Le traitement du trait d’union.

On rencontre 5 cas:

· Les suffixes courants :

  • ar re-mañ, an traoù-se, mat-tre, …
  • ar gwenn-ha-du-se, du-hont, …
  • bras-meurbet, fall-spontus, ...

Dans ce premier cas, le mot privé de son suffixe est testé. S'il est inconnu des dictionnaires seul ce premier mot est souligné.

· Les préfixes ez- et ent- :

  • Ez-laouen, ez-vicherel, …
  • Ent-yaouank, ent-reoliek, …

· Les mots composés :

  • botoù-koad, krogen-Sant-Jakez, ...
  • melc'hwed-krogennek
  • kanod-saveteiñ, bag-dre-lien, ...
  • doare-ober, ...

Pour ces deuxième et troisième cas le mot entier est testé, tiret compris. Il sera souligné d'un seul bloc s'il est absent du dictionnaire.

· Les constructions idiomatiques :

  • lise-mañ-lise, den-mañ-den, ar c'hig-mañ-kig, ...
  • departamant-ha-departamant, pazenn-ha-pazenn, ...
  • hewelusoc'h-hewelusañ, bihan-bihan, hiraetoc'h-hiraetañ ...

Ce quatrième cas est correctement géré.

· Les noms propres associés :

  • Ur gejadenn Bush-Blair, Ur match Williams-Williams,
  • An emgav Frañs-Aostralia, Pont-'n-Abad-Sant-Pêr-Kiberen,
  • Ar baeroniezh Sant-Brieg-Aberystwyth,

Ce cinquième cas peut poser problème.

Le traitement de l'apostrophe.

Le caractère apostrophe pose problème en breton car il fait partie du lexique alphabétique.

On rencontre ainsi 3 cas d’utilisation de l’apostrophe :

· Le c'h :

  • marc'h, alarc'h, melc'hwedenn, floc’h,...
  • c’hwec’h, kreñvoc’h, ...

Si un mot incluant le polygraphe c'h est inconnu du dictionnaire, le mot entier est souligné, comme pour tout autre mot standard.

· L'élision :

  • n'on ket a-du, m'ho peus c'hoant, ma’z, …

Dans le cas de l'élision, l'apostrophe se rattache toujours au premier mot. Ainsi « n'on » se compose du mot élidé « n' » et du mot entier « on ». Les mots « n' » et « on » doivent être présents indépendamment dans le dictionnaire. Chaque mot absent est marqué.

· La contraction :

  • ane'e pour anezhe, de'i pour dezhi, …
  • 'peus pour az peus, …

Dans ce dernier cas le comportement du correcteur est plus aléatoire et dépend globalement de la fréquence des formes contractées. On trouvera 'peus et ane'i dans le dictionnaire, mais d'autres formes plus obscures ou ambiguës pourront être marquées comme inconnues.

[Image]Une remarque importante. Notez que certains logiciels peuvent substituer au caractère apostrophe classique ', dont le code ASCII est 0x06, d'autres types d'apostrophes moins usitées, telles que les caractères 0x60, 0x91, 0x92 et 0xB4. C'est le cas de Microsoft Word en mode autocorrection. C'est aussi le cas de Microsoft PowerPoint. An Drouizig Difazier sait reconnaître ces caractères et les traite comme une apostrophe courante.

Le traitement des majuscules.

Deux cas peuvent être discutés ici. D'une part le cas des majuscules accentuées, d'autre part le cas des graphes « composés », à savoir les cas ch et c'h.

Doit-on autoriser les graphies :

  • Bro-C'Hall ou/et Bro-C'hall ?
  • CHom ou/et Chom ?
  • HAG-EN ou/et HAG-EÑ ?
  • Û ou/et U ?

An Drouizig Difazier autorise les mots Û, HAG-EÑ, Bro-C'hall et Chom.

La mutation des noms propres.

La mutation des noms propres peut être écrite, dans ce cas plusieurs possibilités existent. Elle peut très bien ne pas l’être non plus. Ainsi on trouve historiquement dans la littérature bretonne (« Buhez ar Sent », etc.) la graphie « An Itron Varia ». On pourra trouver aussi la mutation écrite de la façon suivante « An Itron vMaria ».

Il a été choisi de faire muter l’initiale des noms propres dans son intégralité. A l’instar des noms communs, on trouvera donc dans le dictionnaire les noms propres et toutes leurs formes mutées,

  • Karine ® da Garine, Gwenael ® da Wenael, etc.
  • Gwened ® Bro-Wened, Kemper ® Bro-Gemper, etc.

Combien de mots dans le dictionnaire ?

Le dictionnaire contient environ 350000 mots. Soit une base de 20000 mots à laquelle viennent s'ajouter leurs très (très) nombreuses formes dérivées.

· verbes. (17,5%)

  • formes conjuguées.
  • formes mutées et négatives (N'hallan, …).

3500

· noms communs. (65%)

  • formes plurielles et duelles.
  • formes féminines (-ez).
  • formes singulières (pour les collectifs).
  • formes diminutives (-ig, -igoù, -oùigoù, …).
  • formes mutées.

8000 (m.) + 4000 (f.) + 300 (pl.) + 80 (d.) 12380

· adjectifs. (13%)

  • formes diminutives (-ik).
  • formes comparatives (-oc'h).
  • formes superlatives (-añ).
  • formes exclamatives (-at).
  • formes mutées.

2600


· prépositions. (et le reste soit 4,5%)

  • formes conjuguées (warnon, din, evidout, …).
  • formes mutées.

· interjections.
· adverbes.

  • formes mutées (Da belec’h, …).

· pronoms.

  • formes élidées.
  • formes mutées (Da betra, …).

· noms propres  (Prénoms bretons, villes de Bretagne, Pays du monde, villes de France et du monde, …).

  • formes mutées.

· conjonctions
· exclamations
· ordinaux
· cardinaux
· articles
· formes contractées

900

Soit, en tout, une approximation de 20000 mots (350000 formes différentes).