Deutsch

Deutsche Wortliste

csv txtsql

Dieser Datensatz wurde von einem Nutzer am Donnerstag, 5. September 2013, 18:17 Uhr vor 2051 Tagen inseriert.

Beschreibung des Datensatzes


Dieser Datensatz enthält die häufigsten Wörter der deutschen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet.

Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit.


Ausschnitt aus den Daten:

"1","der","9053340","0.0385585367860393"
"2","und","7090046","0.0301967891966624"
"3","die","6246866","0.0266056518874204"
"4","in","5123896","0.0218228777891739"
"5","von","3451023","0.0146980448425628"
"6","den","2832006","0.0120616267067496"
"7","des","2484384","0.0105810907195187"
"8","im","2212037","0.00942115396489916"
"9","mit","2184922","0.00930567009651981"
"10","ist","2013322","0.00857481884024485"
"11","dem","1852972","0.00789188178346344"
"12","wurde","1822873","0.00776368893985843"
"13","das","1796310","0.00765055606153423"
"14","Die","1786747","0.00760982686244474"
"15","zu","1722825","0.00733758051044236"
"16","er","1682782","0.007167035773525"
"17","als","1658328","0.00706288521046587"
"18","ein","1564235","0.00666213936398172"
"19","eine","1550149","0.00660214652717584"
"20","auf","1543140","0.00657229491613137"
"21","sich","1483633","0.00631885222553024"
"22","an","1259199","0.00536297885227374"
"23","war","1238755","0.00527590703943408"
"24","auch","1093288","0.00465635727430268"

Bildvorschau

chart.png

deutscheWortliste.sql.gz
Größe: 12.04M
Download als sql
deutscheWortliste.csv.zip
Größe: 12.33M
Download als csv


Preis: 29,00 €


Schlüsselworte:


Suchbegriffe für diesen Datensatz:



Kommentare zu diesem Datensatz:

26.12.16 21:50 - Test
26.12.16 21:53 - Test2
26.12.16 21:54 - TEST3
26.12.16 22:01 - TEST4
26.12.16 22:56 - Test5
Neuen Kommentar erstellen




Englische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der englischen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO englischeWortliste (id, wort, count, percent) VALUES (1, 'the', 46900999, 0.0658374919539244), (2, 'of', 25900356, 0.0363577432487905), (3, 'and', 21878171, 0.0307115826504907), (4, 'in', 18883923, 0.0265083933195331), (5, 'a', 15610342, 0.0219130890116649), (6, 'to', 15608703, 0.0219107882579153), (7, 'was', 8829758, 0.0123948131953458), (8, 'is', 8762885, 0.0123009399156011), (9, 'The', 7918111, 0.0111150845476187), (10, 'for', 6140305, 0.00861948124030667), (11, 'as', 5739654, 0.0080570655657742), (12, 'on', 5325161, 0.00747521912040407), (13, 'by', 5246009, 0.00736410913822358), (14, 'with', 5243163, 0.00736011405270097), (15, 'that', 4068801, 0.00571159802160333), (16, 'from', 3869104, 0.00543127244408796), (17, 'at', 3584642, 0.00503195760995836), (18, 'his', 3479258, 0.00488402433774656),

Details

Filterliste SPAM-Wörter deutsch txt

Die Datei enthält eine Wortliste mit Beleidigungen und Schimpfworten Sexuell expliziten Vokabular Werbe- und Spamvokabular Es sind vorwiegend deutsche Substantive enthalten - in der Summe knapp 2.000 Wörter. Anwendungsbereiche finden sich in der automatischen Erkennung und Filterung von nichtkonformen Nutzerbeiträgen in: Foren Blogs Emails Chats IRC Mailinglisten Ausschnitt aus den Daten: Armleuchter Arsch Arsch mit Ohren Arschbacke Arschbombe Arschgeige Arschgesicht Arschi Startguthaben Poker Jackpott Gewinnglücksnummer Gewinnanspruch Hitler Nazi Scheiße Arschloch Nutte Sex Viagra ..

Details

Französische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der französischen Sprache, insgesamt mehr als 500.000 Wörter nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO franzoesischeWoerter (id, wort, count, percent) VALUES (1, 'de', 13892845, 0.0624290167015952), (2, 'la', 6929114, 0.0311367307152176), (3, 'et', 5521596, 0.0248118948209284), (4, 'le', 5069918, 0.0227822303853327), (5, 'à', 4542061, 0.0204102472912254), (6, 'en', 3851515, 0.0173072034030067), (7, 'des', 3526702, 0.0158476207040062), (8, 'du', 3254167, 0.0146229549090039), (9, 'les', 3218813, 0.0144640878478319), (10, 'est', 2969567, 0.0133440737184865), (11, 'un', 2221768, 0.0099837572202864), (12, 'dans', 1970330, 0.00885389309948064), (13, 'une', 1900139, 0.00853848217311518), (14, 'par', 1828486, 0.00821650159003667), (15, 'au', 1538522, 0.00691351667954056), (16, 'pour', 1470127, 0.00660617627537528), (17, 'qui', 1414921, 0.00635810208351405), (18, 'Le', 1214940, 0.00545946561351804), (19, 'a', 1133104, 0.0050917266075195), (20, 'que', 1128039, 0.00506896647670443), (21, 'il', 1117142, 0.005019999616785), (22, 'sur', 1098017, 0.00493405934001534), (23, 'Il', 1027565, 0.0046174755816375), (24, 'son', 951934, 0.0042776194209909), (25, 'avec', 933042, 0.00419272615517482), ..

Details