Deutsch

Englische Wortliste

csv txtsql

Dieser Datensatz wurde vom Verkäufer am Mittwoch, 4. Juli 2012, 21:17 Uhr vor 2632 Tagen erstellt.

Beschreibung des Datensatzes


Dieser Datensatz enthält die häufigsten Wörter der englischen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet.

Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit.


Ausschnitt aus den Daten:

INSERT INTO `englischeWortliste` (`id`, `wort`, `count`, `percent`) VALUES
(1, 'the', 46900999, 0.0658374919539244),
(2, 'of', 25900356, 0.0363577432487905),
(3, 'and', 21878171, 0.0307115826504907),
(4, 'in', 18883923, 0.0265083933195331),
(5, 'a', 15610342, 0.0219130890116649),
(6, 'to', 15608703, 0.0219107882579153),
(7, 'was', 8829758, 0.0123948131953458),
(8, 'is', 8762885, 0.0123009399156011),
(9, 'The', 7918111, 0.0111150845476187),
(10, 'for', 6140305, 0.00861948124030667),
(11, 'as', 5739654, 0.0080570655657742),
(12, 'on', 5325161, 0.00747521912040407),
(13, 'by', 5246009, 0.00736410913822358),
(14, 'with', 5243163, 0.00736011405270097),
(15, 'that', 4068801, 0.00571159802160333),
(16, 'from', 3869104, 0.00543127244408796),
(17, 'at', 3584642, 0.00503195760995836),
(18, 'his', 3479258, 0.00488402433774656),

englischeWortliste.sql.zip
Größe: 11.97M
Download als sql
englischeWortliste.csv.zip
Größe: 11.96M
Download als csv


Preis: 29,00 €


Schlüsselworte:


Suchbegriffe für diesen Datensatz:



Noch keine Kommentare zu diesem Datensatz vorhanden:





Deutsche Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der deutschen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: "1","der","9053340","0.0385585367860393" "2","und","7090046","0.0301967891966624" "3","die","6246866","0.0266056518874204" "4","in","5123896","0.0218228777891739" "5","von","3451023","0.0146980448425628" "6","den","2832006","0.0120616267067496" "7","des","2484384","0.0105810907195187" "8","im","2212037","0.00942115396489916" "9","mit","2184922","0.00930567009651981" "10","ist","2013322","0.00857481884024485" "11","dem","1852972","0.00789188178346344" "12","wurde","1822873","0.00776368893985843" "13","das","1796310","0.00765055606153423" "14","Die","1786747","0.00760982686244474" "15","zu","1722825","0.00733758051044236" "16","er","1682782","0.007167035773525" "17","als","1658328","0.00706288521046587" "18","ein","1564235","0.00666213936398172" "19","eine","1550149","0.00660214652717584" "20","auf","1543140","0.00657229491613137" "21","sich","1483633","0.00631885222553024" "22","an","1259199","0.00536297885227374" "23","war","1238755","0.00527590703943408" "24","auch","1093288","0.00465635727430268"

Details

Französische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der französischen Sprache, insgesamt mehr als 500.000 Wörter nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO franzoesischeWoerter (id, wort, count, percent) VALUES (1, 'de', 13892845, 0.0624290167015952), (2, 'la', 6929114, 0.0311367307152176), (3, 'et', 5521596, 0.0248118948209284), (4, 'le', 5069918, 0.0227822303853327), (5, 'à', 4542061, 0.0204102472912254), (6, 'en', 3851515, 0.0173072034030067), (7, 'des', 3526702, 0.0158476207040062), (8, 'du', 3254167, 0.0146229549090039), (9, 'les', 3218813, 0.0144640878478319), (10, 'est', 2969567, 0.0133440737184865), (11, 'un', 2221768, 0.0099837572202864), (12, 'dans', 1970330, 0.00885389309948064), (13, 'une', 1900139, 0.00853848217311518), (14, 'par', 1828486, 0.00821650159003667), (15, 'au', 1538522, 0.00691351667954056), (16, 'pour', 1470127, 0.00660617627537528), (17, 'qui', 1414921, 0.00635810208351405), (18, 'Le', 1214940, 0.00545946561351804), (19, 'a', 1133104, 0.0050917266075195), (20, 'que', 1128039, 0.00506896647670443), (21, 'il', 1117142, 0.005019999616785), (22, 'sur', 1098017, 0.00493405934001534), (23, 'Il', 1027565, 0.0046174755816375), (24, 'son', 951934, 0.0042776194209909), (25, 'avec', 933042, 0.00419272615517482), ..

Details

Englische Bigramme csv txt sql xls

Der Datensatz enthält die häufigsten Buchstabenbigramme englischen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 2 Buchstaben. Man kann damit also eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL, CSV und auch XLS für Excel vorhanden. Encoding ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (127, 2, 'th', 14320528, 0.0191269653477765), (128, 2, 'he', 13799443, 0.0184309871870379), (130, 2, 'in', 11201233, 0.0149607329732095), (133, 2, 'er', 10094645, 0.0134827378650498), (134, 2, 'an', 9888662, 0.0132076202364797), (137, 2, 're', 8086665, 0.0108008141343725), (138, 2, 'on', 7659756, 0.0102306205179322), (141, 2, 'at', 6313486, 0.00843249829515169), (143, 2, 'nd', 6190383, 0.00826807790400359), (144, 2, 'or', 6170943, 0.00824211320449245), (146, 2, 'ed', 6081354, 0.00812245520734724), (147, 2, 'en', 6013232, 0.00803146923717762), (148, 2, 'es', 5986226, 0.00799539914072712), (150, 2, 'ar', 5826560, 0.00778214401150157), (151, 2, 'is', 5819185, 0.00777229372040617), (152, 2, 'te', 5772226, 0.00770957374487411), (154, 2, 'ti', 5464381, 0.0072984058991434), (155, 2, 'al', 5054702, 0.00675122523396739) ...

Download