La Base Surface 2.00
La documentation complète de la base Surface se trouve dans la
documentation officielle de Lexique.
Surface.txt
Pour chaque, sa moyenne et son écart-type de fréquence-token des bigrammes, trigrammes, etc
| Graph | GrTok | GrTokEt | BigrTok | BigrTokEt | TrigrTok | TrigrTokEt | PhonTok | PhonTokEt | SyllTok | SyllTokEt |
| abaissa | 28950.19 | 16528.04 | 3399.29 | 3468.15 | 587.64 | 521.15 | 16491.51 | 23064.28 | 22815.54 | 17605.30 |
Bigr.txt
Pour chaque bigramme, sa fréquence de type et sa fréquence de token pour chacune des positions qu'il peut prendre
| Bigr | Pos1BigrType;Pos1BigrTok | Pos2BigrType;Pos2BigrTok | Pos3BigrType;Pos3BigrTok | Pos4BigrType;Pos4BigrTok | Pos5BigrType;Pos5BigrTok | Pos6BigrType;Pos6BigrTok | Pos7BigrType;Pos7BigrTok | Pos8BigrType;Pos8BigrTok | Pos9BigrType;Pos9BigrTok | Pos10BigrType;Pos10BigrTok |
| ab | 734;1308.86 | 736;1375.05 | 223;522.24 | 372;385 | 256;383.57 | 247;468.88 | 303;353.86 | 299;417.15 | 202;230.38 | 124;159.1 | 40;21.56 | 31;17.67 | 6;0.38 | 0;0 | 0;0 | 0;0 | 0;0 | 0;0 | 0;0 | 0;0 |
BigrMoy.txt
La fréquence moyenne de chaque bigramme (fréquence toutes positions
confondues).C'est la somme de ses fréquences par position. (données
dans Bigr.txt).
| Graph | MoyFreqType | MoyFreqToken |
| ab | 3573 | 5643.7 |
BigrMots.txt
Pour chaque mot, la fréquence de type et la fréquence de token de chacun de ses bigrammes à cette position
| Graph | Pos1BigrType;Pos1BigrTok | Pos2BigrType;Pos2BigrTok | Pos3BigrType;Pos3BigrTok | Pos4BigrType;Pos4BigrTok | Pos5BigrType;Pos5BigrTok | Pos6BigrType;Pos6BigrTok | Pos7BigrType;Pos7BigrTok | Pos8BigrType;Pos8BigrTok | Pos9BigrType;Pos9BigrTok | Pos10BigrType;Pos10BigrTok |
| ab-ba-ai-is-ss-sa | 734;1308.86 | 169;249.63 | 723;10147.2 | 1845;5639.79 | 1347;1911.82 | 739;1138.44 |
BigrMotsMoy.txt
Pour chaque mot, la moyenne de la fréquence des bigrammes le composant (par type puis par token)
| Graph | MoyFreqType | MoyFreqToken | EtTypeEtType | EtToken | Nb Bigrammes |
| ab-ba-ai-is-ss-sa | 926.17 | 3399.29 | 533.52 | 3468.15 | 6 |
Auteurs
Licence
Cette base de données est distribuée sous la même
licence que Lexique.
En résumé, cette base de données est redistribuable ou utilisable dans
un autre produit uniquement si celui-ci est aussi sous licence Gnu
(http://www.gnu.org).
Téléchargement
Surface 2.10
Documentation
Documentation de Lexique
Historique
2.10
-Changement de façon de calculer de
GrMoy.txt, BigrMoy.txt, TrigrMoy.txt, PhonMoy.txt, SyllMoy.txt (Pour
calculer la moyenne d'un bigramme sans position particulières, on ne
fait pas la moyenne des fréquences de toutes les positions qu'il
occupe, mais on fait tout simplement la somme de ces fréquences)