Le
Un question interessantissime in Facebook, per Martin Lavallée: “Qual es le maxime grande dictionario de interlingua?”.
Il sembla facile utilisar le datos textual, que es al base de mi interfacie al varie dictionarios de interlingua (e un de esperanto, in honor al inventor del concepto del interfacie, Paul Denisowski), pro determinar que es le dictionario le major, e illo in secunde loco, etc., dunque facer un ordination hierarchic.
Un prime approche mie esseva profitar del extractor de parolas que io faceva pro mi motor de cerca Siworin, pro extraher e contar tote le parolas in le dictionarios, non solo le parolas del lemmas, ma anque del synonymos, descriptiones e explicationes (in dictionarios unilingue), traductiones (in dictionarios bilingue), e in le exemplos de uso. Le resultatos esseva assi:
Autor / compilator | Linguas | Numero de parolas |
Numero de litteras |
---|---|---|---|
Piet Cleij | nl>ia | 1.532.707 | 11.061.443 |
Piet Cleij | ia>nl | 787.805 | 6.250.123 |
Pian Boalt | sv>ia | 732.372 | 5.416.668 |
Piet Cleij | fr>ia | 716.449 | 5.232.546 |
Toma Macovei | ia>ia | 600.842 | 3.972.767 |
André Schild &
Helmut E. Ruhrig | de>ia | 303.033 | 2.420.339 |
Alexander Gode | ia>en | 188.280 | 1.406.648 |
Jacinto Javier
Bowks DelaRosa | en>ia | 139.318 | 1.025.716 |
Fandom, sin nomine | es>ia | 81.604 | 664.125 |
Carlos Soreto | ia>en | 76.575 | 663.599 |
Brian Sexton &
Frank Peter Gopsill | en>ia | 72.787 | 564.255 |
Woodruff W. Bryne | en>ia | 24.347 | 172.483 |
Totevia, iste comparation non es completemente honeste, a causa de complicationes technic que io ha mesme causate.
Alexander Gode in su IED (Interlingua-English Dictionary)
de certe vocabulos ha clarificate lor structura, per exemplo
iso·scele
. A fin que le parola sia anque trovate per
simplicemente cercar con isoscele
, in le file de texto
io ha modificate
iso·scele
a isoscele (iso·scele)
.
Pois que in Unicode le character de separation hic usate, nam ‘·’,
non es considerate alphabetic, e in mi programma pro le extraction
de parolas io non ha un regula special pro iste como io ha pro le
tracto de union ‘-’, duo parolas additional es contate sin bon
ration, nam iso
e scele
.
In multe dictionarios, a saper
de>ia
,
fr>ia
,
nl>ia
,
ia>nl
e
sv>ia
,
accentuationes deviante del
regular es indicate per
sublinear le vocal in le syllaba in question. Pro le mesme ration que
in alto, nam le cercabilitate e trovabilitate, io ha modificate per exemplo
ins<u>i</u>mul
a
insimul (ins<u>i</u>mul)
.
Le separator de parolas non lo comprende e conta immeritatemente
le extra parolas ins
e mul
. Specialmente
in le dictionario de nl>ia
de Piet Cleij isto eveni anque
cata vice si un tal parola occurre in le traduction de un expression o
phrase nederlandese, que injustemente multo accresce le numero de parolas
usate in le dictionario.
Pro iste rationes io ora anque face un numeration plus simplice: lo del lineas in le files de texto. Isto include le lemma, e le exemplos.
Autor / compilator | Linguas | Numero de lineas |
---|---|---|
Piet Cleij | nl>ia | 253.047 |
Piet Cleij | ia>nl | 150.729 |
Piet Cleij | fr>ia | 129.202 |
Pian Boalt | sv>ia | 128.688 |
André Schild &
Helmut E. Ruhrig | de>ia | 76.938 |
Jacinto Javier
Bowks DelaRosa | en>ia | 75.846 |
Toma Macovei | ia>ia | 48.691 |
Alexander Gode | ia>en | 34.928 |
Fandom, sin nomine | es>ia | 22.840 |
Brian Sexton &
Frank Peter Gopsill | en>ia | 18.627 |
Carlos Soreto | ia>en | 18.112 |
Woodruff W. Bryne | en>ia | 5.971 |
Conclusion: Piet Cleij e Pian Boalt remane le campiones. In tertie position indecidite es Schild&Ruhrig e Macovei. Toma Macovei in le ultime lista es multo plus basse, ma isto de novo ha un ration technic: in le file que io usa, multe expressiones e exemplos es in un sol linea, le linea le plus longe ha 1867 characteres. In le dictionarios de Piet Cleij, in contrasto le expressiones e exemplos es in lineas separate cata un.