|base|description| |----|-----------| |[Lexique-Infra-Stats-Infra](https://chrplr.github.io/openlexicon/datasets-info/Lexique-Infra/README-Lexique-Infra.html) | Lexique-Infra est une base de données lexicales du français qui fournit pour 140 000 mots du français les fréquences des lettres, bigrammes, trigrammes, phonèmes, syllabes, etc.) | |[lexique3](https://chrplr.github.io/openlexicon/datasets-info/Voisins/README-Voisins..html) | L'une de définitions possible des voisins orthographiques d'un mot sont les mots qui peuvent être créés en changeant une lettre sans modifier pour autant la position des autres lettres (formant une 'paire minimale'). La table `Voisins` a été construite à partir des 130000 entrées de la base `Graphemes` de Lexique262. Elle est constituée des champs suivants: *Graph: Toutes les entrées orthographiques de Lexique2; *NbVoisOrth: Le nombre de voisins orthographiques; *VoisOrth: Les différents voisins orthographiques. *FreqVoisOrth: Les différentes fréquences (de la bases de livres Frantext et par million) de chacun des voisins; *FreqCum: La fréquence cumulée de tous les voisins. | |[WorldLex-French](https://chrplr.github.io/openlexicon/datasets-info/WorldLex/README-Worldlex.html) | WorldLex provides word frequencies tables estimated from web pages (Blog, Twitter and Newspapers). | |[anagrammes](https://chrplr.github.io/openlexicon/datasets-info/anagrammes/README-anagrammes.html) | Le fichier `anagrammes.txt` liste plus de 25000 ensembles d'anagrammes calculés à partir d'une liste de plus de 300.000 mots français. Le script Python ayant servi à calculer ces anagrammes est accessible par les liens ci-dessous. | |[SUTLEX-US](https://chrplr.github.io/openlexicon/datasets-info/SUBTLEX-US/README-SUBTLEXus.html) | SubtlexUS is database containing word frequencies based on English and American movies and TV series subtitles (51 million words in total). This table corresponds to the file '74286words' | |[lexique3](https://chrplr.github.io/openlexicon/datasets-info/Lexique382/README-Lexique.html) | Lexique382 est une base de données lexicales du français qui fournit pour ~140000 mots du français: les représentations orthographiques et phonémiques, les lemmes associés, la syllabation, la catégorie grammaticale, le genre et le nombre, les fréquences dans un corpus de livres et dans un corpus de sous-titres de films, etc. | |[Megalex-visual](https://chrplr.github.io/openlexicon/datasets-info/Megalex/README-Megalex.html) | _Megalex-visual_ provides visual lexical decision times and accuracy rates for 28466 French words | |[Megalex-auditory](https://chrplr.github.io/openlexicon/datasets-info/Megalex/README-Megalex.html) | _Megalex-auditory_ provides auditory lexical decision times and accuracy rates for 17878 French words | |[lexique383](https://chrplr.github.io/openlexicon/datasets-info/Lexique383/README-Lexique.html) | Lexique383 est une base de données lexicales du français qui fournit pour ~140000 mots du français: les représentations orthographiques et phonémiques, les lemmes associés, la syllabation, la catégorie grammaticale, le genre et le nombre, les fréquences dans un corpus de livres et dans un corpus de sous-titres de films, etc. | |[WorldLex-English](https://chrplr.github.io/openlexicon/datasets-info/WorldLex/README-Worldlex.html) | WorldLex provides word frequencies tables estimated from web pages (Blog, Twitter and Newspapers). | |[Lexique-Infra-Stats-Infra](https://chrplr.github.io/openlexicon/datasets-info/Lexique-Infra/README-Lexique-Infra.html) | Lexique-Infra est une base de données lexicales du français qui fournit pour ~140 000 mots du français un ensembles de statitistiques concernant les correspondances Graphèmes-Phonèmes ou Phonèmes-Graphèmes ( décomposition graphèmes-phonèmes,consistance,nombre d'irrégularités, etc. | |[SUTLEX-US](https://chrplr.github.io/openlexicon/datasets-info/SUBTLEX-US/README-SUBTLEXus.html) | Subtlex-US-corpus gathers English and American movies and TV series subtitles (51 million words in total). | |[FrenchLexiconProject-words](https://chrplr.github.io/openlexicon/datasets-info/FrenchLexiconProject/README-FrenchLexiconProject.html) | The French Lexicon Project (FLP) provides lexical decision data for 38,840 French words and the same number of nonwords. The full data represents 1942000 reactions times from 975 participants. |