Université Savoie Mont Blanc LPNC Lexique - Une Base de Données Lexicales Libre RISC CNRS
Un site réalisé par Boris New & Christophe Pallier et hébergé par le RISC


Menu principal


La base surface 2.0


La documentation complète de la base Surface se trouve dans la documentation officielle de Lexique.

Surface.txt

Pour chaque, sa moyenne et son écart-type de fréquence-token des bigrammes, trigrammes, etc
GraphGrTokGrTokEtBigrTokBigrTokEtTrigrTokTrigrTokEtPhonTokPhonTokEtSyllTokSyllTokEt
abaissa28950.1916528.043399.293468.15587.64521.1516491.5123064.2822815.5417605.30

Bigr.txt

Pour chaque bigramme, sa fréquence de type et sa fréquence de token pour chacune des positions qu'il peut prendre
BigrPos1BigrType;Pos1BigrTokPos2BigrType;Pos2BigrTokPos3BigrType;Pos3BigrTokPos4BigrType;Pos4BigrTokPos5BigrType;Pos5BigrTokPos6BigrType;Pos6BigrTokPos7BigrType;Pos7BigrTokPos8BigrType;Pos8BigrTokPos9BigrType;Pos9BigrTokPos10BigrType;Pos10BigrTok
ab734;1308.86736;1375.05223;522.24372;385256;383.57247;468.88303;353.86299;417.15202;230.38124;159.140;21.5631;17.676;0.380;00;00;00;00;00;00;0

BigrMoy.txt

La fréquence moyenne de chaque bigramme (fréquence toutes positions confondues).C'est la somme de ses fréquences par position. (données dans Bigr.txt).
GraphMoyFreqTypeMoyFreqToken
ab35735643.7

BigrMots.txt

Pour chaque mot, la fréquence de type et la fréquence de token de chacun de ses bigrammes à cette position
GraphPos1BigrType;Pos1BigrTokPos2BigrType;Pos2BigrTokPos3BigrType;Pos3BigrTokPos4BigrType;Pos4BigrTokPos5BigrType;Pos5BigrTokPos6BigrType;Pos6BigrTokPos7BigrType;Pos7BigrTokPos8BigrType;Pos8BigrTokPos9BigrType;Pos9BigrTokPos10BigrType;Pos10BigrTok
ab-ba-ai-is-ss-sa734;1308.86169;249.63723;10147.21845;5639.791347;1911.82739;1138.44

BigrMotsMoy.txt

Pour chaque mot, la moyenne de la fréquence des bigrammes le composant (par type puis par token)
GraphMoyFreqTypeMoyFreqTokenEtTypeEtTypeEtTokenNb Bigrammes
ab-ba-ai-is-ss-sa926.173399.29533.523468.156

Auteurs

  • L'équipe de Lexique

Licence

Cette base de données est distribuée sous la même licence que Lexique. En résumé, cette base de données est redistribuable ou utilisable dans un autre produit uniquement si celui-ci est aussi sous licence Gnu (http://www.gnu.org).

Téléchargement

Surface 2.10

Documentation

Documentation de Lexique

Historique

2.10

-Changement de façon de calculer de GrMoy.txt, BigrMoy.txt, TrigrMoy.txt, PhonMoy.txt, SyllMoy.txt (Pour calculer la moyenne d'un bigramme sans position particulières, on ne fait pas la moyenne des fréquences de toutes les positions qu'il occupe, mais on fait tout simplement la somme de ces fréquences)
Lexique - Une Base de Données Lexicales Libre
Copyleft © 2001 Lexique
Powered by phpWebLog