Université de Savoie LPNC Lexique - Une Base de Données Lexicales Libre RISC CNRS
Un site réalisé par Boris New & Christophe Pallier et hébergé par le RISC


Menu principal


Présentation de Lexique


Lexique 3 est une base de données qui fournit pour 135 000 mots du français: les représentations orthographiques et phonémiques, la syllabation, la catégorie grammaticale, le genre et le nombre, les fréquences, les lemmes associés, etc.

Si vous êtes nouveau venu, commencez par télécharger et lire le manuel de Lexique.

Lexique permet d'obtenir des informations précises sur un mot ou, par exemple, de calculer diverses statistiques du français.

Ces informations sont stockées dans des tables que vous pouvez télécharger sur votre ordinateur ou interroger en ligne.

Lexique est une base de données libre à laquelle chacun est encouragé à participer.



Lexique fournit
  • 135 000 mots
  • 55 000 lemmes (Lexique 2 + Lexique 3)
  • la fréquence écrite de ces mots selon une base de texte de 15 millions de mots (Frantext)
  • le genre, le nombre, la catégorie grammaticale
  • la représentation phonologique
  • le nombre de phonèmes, de lettres
  • le point d'unicité
  • la structure orthographique ou phonologique abstraite
  • la forme syllabée
  • le nombre de voisins orthographiques et phonologiques
  • la famille flexionnelle des lemmes
  • la fréquence cumulée des lemmes
  • distribuée sous licence GNU-like
  • Fréquences des lettres, phonèmes, bigrammes, trigrammes, syllabes
  • etc., etc.
Open Lexique c'est
  • Le moteur de recherche en ligne permettant d'interroger Lexique
  • 7 bases de données interrogeables simultanément:
  • Une base de prénoms avec leur sexe, langage d'utilisation et frequence [Prenoms 1.00]
  • Tous les anagrammes de tous les mots de Lexique [Anagrammes]
  • Tous les voisins orthographiques et leur fréquence [Voisins]
  • Tous les mots et nonmots (incluant les noms propres, les onomatopées, etc.) de Frantext (250 000 entrées) et leurs fréquences [Fréquences Frantext]
Undows c'est
  • L'environnement hors-ligne d'interrogation de Lexique
  • Un environnement unix simplifié pour Windows (9X, 2000, XP) et le traitement de bases de données
  • Awk, Perl, Bash, Textutils, Sed, Wget, etc
  • De nombreux exemples de scripts perl et awk pour réaliser des tâches courantes en psycholinguistique/linguistique
  • Beaucoup de documentations sur comment utiliser les outils GNU en psycholinguistique/linguistique
Lexique - Une Base de Données Lexicales Libre
Copyleft © 2001 Lexique
Powered by phpWebLog