Université Paris5 Lexique - Une Base de Données Lexicales Libre CNRS
Un site réalisé par Boris New & Christophe Pallier et hébergé par le RISC
Menu principal
  • Accueil
  • Nouveautés
  • Interroger Open Lexique
  • Télécharger
  • Documentation
  • Forums de discussion
  • Fil Rss
  • Autres ressources
  • Contributeurs
  • Qui utilise Lexique
  • Listes Diverses
  • UnDows
  • Lexique Toolbox

  • La Base Surface 2.00

    La documentation complète de la base Surface se trouve dans la documentation officielle de Lexique.

    Surface.txt

    Pour chaque, sa moyenne et son écart-type de fréquence-token des bigrammes, trigrammes, etc
    GraphGrTokGrTokEtBigrTokBigrTokEtTrigrTokTrigrTokEtPhonTokPhonTokEtSyllTokSyllTokEt
    abaissa28950.1916528.043399.293468.15587.64521.1516491.5123064.2822815.5417605.30

    Bigr.txt

    Pour chaque bigramme, sa fréquence de type et sa fréquence de token pour chacune des positions qu'il peut prendre
    BigrPos1BigrType;Pos1BigrTokPos2BigrType;Pos2BigrTokPos3BigrType;Pos3BigrTokPos4BigrType;Pos4BigrTokPos5BigrType;Pos5BigrTokPos6BigrType;Pos6BigrTokPos7BigrType;Pos7BigrTokPos8BigrType;Pos8BigrTokPos9BigrType;Pos9BigrTokPos10BigrType;Pos10BigrTok
    ab734;1308.86736;1375.05223;522.24372;385256;383.57247;468.88303;353.86299;417.15202;230.38124;159.140;21.5631;17.676;0.380;00;00;00;00;00;00;0

    BigrMoy.txt

    La fréquence moyenne de chaque bigramme (fréquence toutes positions confondues).C'est la somme de ses fréquences par position. (données dans Bigr.txt).
    GraphMoyFreqTypeMoyFreqToken
    ab35735643.7

    BigrMots.txt

    Pour chaque mot, la fréquence de type et la fréquence de token de chacun de ses bigrammes à cette position
    GraphPos1BigrType;Pos1BigrTokPos2BigrType;Pos2BigrTokPos3BigrType;Pos3BigrTokPos4BigrType;Pos4BigrTokPos5BigrType;Pos5BigrTokPos6BigrType;Pos6BigrTokPos7BigrType;Pos7BigrTokPos8BigrType;Pos8BigrTokPos9BigrType;Pos9BigrTokPos10BigrType;Pos10BigrTok
    ab-ba-ai-is-ss-sa734;1308.86169;249.63723;10147.21845;5639.791347;1911.82739;1138.44

    BigrMotsMoy.txt

    Pour chaque mot, la moyenne de la fréquence des bigrammes le composant (par type puis par token)
    GraphMoyFreqTypeMoyFreqTokenEtTypeEtTypeEtTokenNb Bigrammes
    ab-ba-ai-is-ss-sa926.173399.29533.523468.156

    Auteurs

    • L'équipe de Lexique

    Licence

    Cette base de données est distribuée sous la même licence que Lexique. En résumé, cette base de données est redistribuable ou utilisable dans un autre produit uniquement si celui-ci est aussi sous licence Gnu (http://www.gnu.org).

    Téléchargement

    Surface 2.10

    Documentation

    Documentation de Lexique

    Historique

    2.10

    -Changement de façon de calculer de GrMoy.txt, BigrMoy.txt, TrigrMoy.txt, PhonMoy.txt, SyllMoy.txt (Pour calculer la moyenne d'un bigramme sans position particulières, on ne fait pas la moyenne des fréquences de toutes les positions qu'il occupe, mais on fait tout simplement la somme de ces fréquences)
    Lexique - Une Base de Données Lexicales Libre
    Copyleft © 2001 Lexique
    Powered by phpWebLog