Deutsch

Filterliste SPAM-Wörter deutsch

txt

Das Angebot wurde vom Verkäufer am Sonntag, 24. März 2013, 05:17 Uhr vor 2187 Tagen inseriert.

Beschreibung des Datensatzes


Die Datei enthält eine Wortliste mit


  • Beleidigungen und Schimpfworten
  • Sexuell expliziten Vokabular
  • Werbe- und Spamvokabular

Es sind vorwiegend deutsche Substantive enthalten - in der Summe knapp 2.000 Wörter.


Anwendungsbereiche finden sich in der automatischen Erkennung und Filterung von nichtkonformen Nutzerbeiträgen in:
  • Foren
  • Blogs
  • Emails
  • Chats
  • IRC
  • Mailinglisten 
Ausschnitt aus den Daten:



Armleuchter
Arsch
Arsch mit Ohren
Arschbacke
Arschbombe
Arschgeige
Arschgesicht
Arschi



Startguthaben
Poker
Jackpott
Gewinnglücksnummer
Gewinnanspruch



Hitler
Nazi
Scheiße
Arschloch
Nutte
Sex
Viagra

..

bad_word_list.txt
Größe: 18.51K
Download als txt


Preis: 25,00 €
Hinweis zu Datensätzen mit Emailadresse: Die Nutzung von Email-Adressen zu Marketingzwecken ist in Deutschland u.A. nur dann zulässig, wenn der Empfänger dem Sender seine ausdrückliche Zustimmung dafür gegeben hat. Ein solches Opt-In liegt, sofern nicht anders angegeben, hier nicht vor.


Schlüsselworte:


Suchbegriffe für diesen Datensatz:



Noch keine Kommentare zu diesem Datensatz vorhanden:





Deutsche Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der deutschen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: "1","der","9053340","0.0385585367860393" "2","und","7090046","0.0301967891966624" "3","die","6246866","0.0266056518874204" "4","in","5123896","0.0218228777891739" "5","von","3451023","0.0146980448425628" "6","den","2832006","0.0120616267067496" "7","des","2484384","0.0105810907195187" "8","im","2212037","0.00942115396489916" "9","mit","2184922","0.00930567009651981" "10","ist","2013322","0.00857481884024485" "11","dem","1852972","0.00789188178346344" "12","wurde","1822873","0.00776368893985843" "13","das","1796310","0.00765055606153423" "14","Die","1786747","0.00760982686244474" "15","zu","1722825","0.00733758051044236" "16","er","1682782","0.007167035773525" "17","als","1658328","0.00706288521046587" "18","ein","1564235","0.00666213936398172" "19","eine","1550149","0.00660214652717584" "20","auf","1543140","0.00657229491613137" "21","sich","1483633","0.00631885222553024" "22","an","1259199","0.00536297885227374" "23","war","1238755","0.00527590703943408" "24","auch","1093288","0.00465635727430268"

Details

Englische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der englischen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO englischeWortliste (id, wort, count, percent) VALUES (1, 'the', 46900999, 0.0658374919539244), (2, 'of', 25900356, 0.0363577432487905), (3, 'and', 21878171, 0.0307115826504907), (4, 'in', 18883923, 0.0265083933195331), (5, 'a', 15610342, 0.0219130890116649), (6, 'to', 15608703, 0.0219107882579153), (7, 'was', 8829758, 0.0123948131953458), (8, 'is', 8762885, 0.0123009399156011), (9, 'The', 7918111, 0.0111150845476187), (10, 'for', 6140305, 0.00861948124030667), (11, 'as', 5739654, 0.0080570655657742), (12, 'on', 5325161, 0.00747521912040407), (13, 'by', 5246009, 0.00736410913822358), (14, 'with', 5243163, 0.00736011405270097), (15, 'that', 4068801, 0.00571159802160333), (16, 'from', 3869104, 0.00543127244408796), (17, 'at', 3584642, 0.00503195760995836), (18, 'his', 3479258, 0.00488402433774656),

Details

Französische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der französischen Sprache, insgesamt mehr als 500.000 Wörter nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO franzoesischeWoerter (id, wort, count, percent) VALUES (1, 'de', 13892845, 0.0624290167015952), (2, 'la', 6929114, 0.0311367307152176), (3, 'et', 5521596, 0.0248118948209284), (4, 'le', 5069918, 0.0227822303853327), (5, 'à', 4542061, 0.0204102472912254), (6, 'en', 3851515, 0.0173072034030067), (7, 'des', 3526702, 0.0158476207040062), (8, 'du', 3254167, 0.0146229549090039), (9, 'les', 3218813, 0.0144640878478319), (10, 'est', 2969567, 0.0133440737184865), (11, 'un', 2221768, 0.0099837572202864), (12, 'dans', 1970330, 0.00885389309948064), (13, 'une', 1900139, 0.00853848217311518), (14, 'par', 1828486, 0.00821650159003667), (15, 'au', 1538522, 0.00691351667954056), (16, 'pour', 1470127, 0.00660617627537528), (17, 'qui', 1414921, 0.00635810208351405), (18, 'Le', 1214940, 0.00545946561351804), (19, 'a', 1133104, 0.0050917266075195), (20, 'que', 1128039, 0.00506896647670443), (21, 'il', 1117142, 0.005019999616785), (22, 'sur', 1098017, 0.00493405934001534), (23, 'Il', 1027565, 0.0046174755816375), (24, 'son', 951934, 0.0042776194209909), (25, 'avec', 933042, 0.00419272615517482), ..

Details