Deutsch

Suchergebnisse für "Linguistik"
< Zurück 1 2 Vorwärts >

Deutsche Trigramme csv txt sql

Der Datensatz enthält die häufigsten Buchstabentrigramme deutschen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 3 Buchstaben. Man kann damit z.B. eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL und CSV. Die Zeichencodierung ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (9015, 3, 'der', 1466004, 0.00765538408168634), (9017, 3, 'ein', 1241199, 0.00648146598972786), (9018, 3, 'sch', 1205611, 0.00629562760954673), (9019, 3, 'ich', 1195695, 0.00624384685822955), (9022, 3, 'che', 1014516, 0.00529774109553323), (9023, 3, 'die', 913767, 0.00477163592061842), (9024, 3, 'und', 904872, 0.00472518676945198), (9028, 3, 'den', 821339, 0.00428898250364131), (9030, 3, 'ine', 775831, 0.0040513424843853), (9031, 3, 'ten', 764684, 0.00399313352563856), (9033, 3, 'ung', 706683, 0.00369025581717263), (9034, 3, 'nde', 684003, 0.00357182223106192), (9035, 3, 'gen', 647717, 0.00338233893716363), (9038, 3, 'ter', 600607, 0.00313633337095219), (9039, 3, 'hen', 598021, 0.00312282943560464), (9040, 3, 'cht', 576579, 0.00301086061049944), ...

Details

Deutsche Bigramme csv txt sql xls

Der Datensatz enthält die häufigsten Buchstabenbigramme deutschen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 2 Buchstaben. Man kann damit also eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL, CSV und auch XLS für Excel vorhanden. Encoding ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (124, 2, 'er', 5765776, 0.0298532541129943), (125, 2, 'en', 5581917, 0.028901293882843), (127, 2, 'ch', 3962383, 0.0205158900713467), (129, 2, 'de', 3503595, 0.0181404396986661), (132, 2, 'ei', 2900830, 0.0150195247142097), (133, 2, 'te', 2741528, 0.0141947123929007), (134, 2, 'in', 2716095, 0.0140630288498952), (135, 2, 'ie', 2661359, 0.0137796242019989), (138, 2, 'nd', 2096475, 0.0108548443291137), (139, 2, 'un', 1929248, 0.0099889990160884), (140, 2, 'ge', 1896304, 0.00981842603449867), (141, 2, 'st', 1732421, 0.00896989483179502), (142, 2, 'es', 1600673, 0.00828774788004407), ..

Download

Englische Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der englischen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: INSERT INTO englischeWortliste (id, wort, count, percent) VALUES (1, 'the', 46900999, 0.0658374919539244), (2, 'of', 25900356, 0.0363577432487905), (3, 'and', 21878171, 0.0307115826504907), (4, 'in', 18883923, 0.0265083933195331), (5, 'a', 15610342, 0.0219130890116649), (6, 'to', 15608703, 0.0219107882579153), (7, 'was', 8829758, 0.0123948131953458), (8, 'is', 8762885, 0.0123009399156011), (9, 'The', 7918111, 0.0111150845476187), (10, 'for', 6140305, 0.00861948124030667), (11, 'as', 5739654, 0.0080570655657742), (12, 'on', 5325161, 0.00747521912040407), (13, 'by', 5246009, 0.00736410913822358), (14, 'with', 5243163, 0.00736011405270097), (15, 'that', 4068801, 0.00571159802160333), (16, 'from', 3869104, 0.00543127244408796), (17, 'at', 3584642, 0.00503195760995836), (18, 'his', 3479258, 0.00488402433774656),

Details

Deutsche Wortliste csv txt sql

Dieser Datensatz enthält die häufigsten Wörter der deutschen Sprache. Die Datenbank enthält mehr als 1 Millionen Worte nach ihrer Häufigkeit geordnet. Das Datenformat ist SQL und CSV. Die Datenfelder enthalten den Rangplatz, das Wort, die absolute und relative Häufigkeit. Ausschnitt aus den Daten: "1","der","9053340","0.0385585367860393" "2","und","7090046","0.0301967891966624" "3","die","6246866","0.0266056518874204" "4","in","5123896","0.0218228777891739" "5","von","3451023","0.0146980448425628" "6","den","2832006","0.0120616267067496" "7","des","2484384","0.0105810907195187" "8","im","2212037","0.00942115396489916" "9","mit","2184922","0.00930567009651981" "10","ist","2013322","0.00857481884024485" "11","dem","1852972","0.00789188178346344" "12","wurde","1822873","0.00776368893985843" "13","das","1796310","0.00765055606153423" "14","Die","1786747","0.00760982686244474" "15","zu","1722825","0.00733758051044236" "16","er","1682782","0.007167035773525" "17","als","1658328","0.00706288521046587" "18","ein","1564235","0.00666213936398172" "19","eine","1550149","0.00660214652717584" "20","auf","1543140","0.00657229491613137" "21","sich","1483633","0.00631885222553024" "22","an","1259199","0.00536297885227374" "23","war","1238755","0.00527590703943408" "24","auch","1093288","0.00465635727430268"

Details
< Zurück 1 2 Vorwärts >

Sie haben den gewünschten Datensatz nicht gefunden? Dann erstellen Sie doch einfach und kostenlos ein Datengesuch, damit ihnen Datenanbieter gezielt die benötigten Daten bereitstellen können.