Lexique est une base de données qui fournit les fréquences d’occurrences dans différents corpus, les lemmes associés, les représentations phonémiques, la syllabation, la catégorie grammaticale, et bien d’autres informations pour environ 142.000 mots de la langue française.


Openlexicon rassemble plusieurs bases de données lexicales (par exemple, FrenchLexiconProject, SUBTLEX-US, …) :


Pour faire de la science reproductible, nous vous conseillons vivement, pour sélectionner du matériel expérimental, d’écrire des scripts, en R ou en Python. Voir “Comment interroger lexique avec R?” et “Comment interroger Lexique avec Python?”.


Lexique est un projet collaboratif auquel tout le monde est encouragé à participer. N’hésitez pas à poser des questions sur le forum, et à proposer des améliorations du code (shiny apps, scripts, …) sur le site github d’Openlexicon.