Deutsch

Suchergebnisse für "Buchstaben"
< Zurück 1 2 Vorwärts >

Buchstabenhäufigkeit von deutschen Nachnamen xls

Der Datensatz enthält die prozentuale Häufigkeit mit der ein Buchstabe als Anfangsbuchstabe eines deutschen Nachnamens auftaucht. Die Analyse basiert auf der Verarbeitung von mehreren Millionen Nachnamen in ihrer realen Auftretenswahrscheinlichkeit in Deutschland.

Download

Morsecodes csv txt

Die Datei enthält den Morsecode zu jedem Buchstaben des Alphabets. Die Datei ist als Tabulatorgetrenntes .CSV beliebig weiterverarbeitbar und damit auch in EXCEL importierbar. Ausschnitt aus den Daten: A .- B -... C -.-. D -.. E . F ..-. G --. H .... I .. J .--- K -.- L .-.. M -- N - O --- P .--. Q --.- R .-. S ... T - U ..- V ...- W .-- X -..- Y -.-- Z --.. Ä .-.- Ö ---. Ü ..-- ß ...--... 0 ----- 1 .---- 2 ..--- 3 ...-- 4 ....- 5 ..... 6 -.... 7 --... 8 ---.. 9 ----.

Download

Englische Trigramme csv txt sql

Der Datensatz enthält die häufigsten Buchstabentrigramme englischen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 3 Buchstaben. Man kann damit z.B. eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL und CSV. Die Zeichencodierung ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (10042, 3, 'and', 4373077, 0.00588827720839116), (10045, 3, 'ing', 3527528, 0.00474975920258473), (10054, 3, 'ion', 2805181, 0.00377713069029242), (10059, 3, 'ent', 2194825, 0.00295529624196124), (10061, 3, 'tio', 2177270, 0.00293165871936712), (10071, 3, 'for', 1777732, 0.00239368728660109), (10075, 3, 'ter', 1733631, 0.00233430600583076), (10077, 3, 'her', 1661225, 0.00223681250193162), (10078, 3, 'ati', 1645746, 0.00221597027964541), (10083, 3, 'The', 1568356, 0.00211176590063324), (10084, 3, 'ate', 1554016, 0.00209245732336183), (10089, 3, 'ere', 1381306, 0.00185990611132938), (10090, 3, 'ver', 1375222, 0.00185171410406862), (10095, 3, 'was', 1309621, 0.00176338342222889), (10101, 3, 'ted', 1291422, 0.00173887876408646), (10103, 3, 'ers', 1254601, 0.00168929988516661), (10104, 3, 'all', 1249597, 0.00168256208037818), (10108, 3, 'are', 1205797, 0.00162358609122282), (10109, 3, 'hat', 1197634, 0.00161259474420284), (10111, 3, 'tha', 1189543, 0.00160170034401435), ...

Details

Englische Bigramme csv txt sql xls

Der Datensatz enthält die häufigsten Buchstabenbigramme englischen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 2 Buchstaben. Man kann damit also eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL, CSV und auch XLS für Excel vorhanden. Encoding ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (127, 2, 'th', 14320528, 0.0191269653477765), (128, 2, 'he', 13799443, 0.0184309871870379), (130, 2, 'in', 11201233, 0.0149607329732095), (133, 2, 'er', 10094645, 0.0134827378650498), (134, 2, 'an', 9888662, 0.0132076202364797), (137, 2, 're', 8086665, 0.0108008141343725), (138, 2, 'on', 7659756, 0.0102306205179322), (141, 2, 'at', 6313486, 0.00843249829515169), (143, 2, 'nd', 6190383, 0.00826807790400359), (144, 2, 'or', 6170943, 0.00824211320449245), (146, 2, 'ed', 6081354, 0.00812245520734724), (147, 2, 'en', 6013232, 0.00803146923717762), (148, 2, 'es', 5986226, 0.00799539914072712), (150, 2, 'ar', 5826560, 0.00778214401150157), (151, 2, 'is', 5819185, 0.00777229372040617), (152, 2, 'te', 5772226, 0.00770957374487411), (154, 2, 'ti', 5464381, 0.0072984058991434), (155, 2, 'al', 5054702, 0.00675122523396739) ...

Download

Buchstabenhäufigkeit im Englischen csv txt sql xls

Der Datensatz enthält die Häufigkeiten der einzelnen Buchstaben in der englischen Sprache. Angegeben ist jeweils die prozentuale Häufigkeit zu jedem möglichen Buchstaben oder Zeichen. Die Daten sind in den Formaten SQL, CSV und auch XLS für Excel vorhanden. Encoding ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (1, 1, ' ', 121541707, 0.161037305392267), (2, 1, 'e', 72242950, 0.0957186655407781), (3, 1, 't', 50431134, 0.0668189885405865), (4, 1, 'a', 50160580, 0.0664605166365914), (5, 1, 'i', 44266852, 0.0586515916242502), (6, 1, 'o', 44158557, 0.0585081056109473), (7, 1, 'n', 43034140, 0.0570183035645004), (8, 1, 'r', 38151841, 0.0505494765709864), (9, 1, 's', 38109560, 0.0504934561441112), (10, 1, 'h', 28342331, 0.0375523162001971), (11, 1, 'l', 24274533, 0.0321626664662169), (12, 1, 'd', 22011889, 0.0291647647432965), ...

Download

Deutsche Trigramme csv txt sql

Der Datensatz enthält die häufigsten Buchstabentrigramme deutschen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 3 Buchstaben. Man kann damit z.B. eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL und CSV. Die Zeichencodierung ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (9015, 3, 'der', 1466004, 0.00765538408168634), (9017, 3, 'ein', 1241199, 0.00648146598972786), (9018, 3, 'sch', 1205611, 0.00629562760954673), (9019, 3, 'ich', 1195695, 0.00624384685822955), (9022, 3, 'che', 1014516, 0.00529774109553323), (9023, 3, 'die', 913767, 0.00477163592061842), (9024, 3, 'und', 904872, 0.00472518676945198), (9028, 3, 'den', 821339, 0.00428898250364131), (9030, 3, 'ine', 775831, 0.0040513424843853), (9031, 3, 'ten', 764684, 0.00399313352563856), (9033, 3, 'ung', 706683, 0.00369025581717263), (9034, 3, 'nde', 684003, 0.00357182223106192), (9035, 3, 'gen', 647717, 0.00338233893716363), (9038, 3, 'ter', 600607, 0.00313633337095219), (9039, 3, 'hen', 598021, 0.00312282943560464), (9040, 3, 'cht', 576579, 0.00301086061049944), ...

Details

Deutsche Bigramme csv txt sql xls

Der Datensatz enthält die häufigsten Buchstabenbigramme deutschen Sprache. Also die prozentuale Häufigkeit von jeder möglichen Kombination aus 2 Buchstaben. Man kann damit also eine automatisierte Spracherkennung von beliebigen Texten durchführen. Die Daten sind in den Formaten SQL, CSV und auch XLS für Excel vorhanden. Encoding ist UTF8. Ausschnitt aus den Daten: INSERT INTO ngramme (id, n, buchstabe, count, percent) VALUES (124, 2, 'er', 5765776, 0.0298532541129943), (125, 2, 'en', 5581917, 0.028901293882843), (127, 2, 'ch', 3962383, 0.0205158900713467), (129, 2, 'de', 3503595, 0.0181404396986661), (132, 2, 'ei', 2900830, 0.0150195247142097), (133, 2, 'te', 2741528, 0.0141947123929007), (134, 2, 'in', 2716095, 0.0140630288498952), (135, 2, 'ie', 2661359, 0.0137796242019989), (138, 2, 'nd', 2096475, 0.0108548443291137), (139, 2, 'un', 1929248, 0.0099889990160884), (140, 2, 'ge', 1896304, 0.00981842603449867), (141, 2, 'st', 1732421, 0.00896989483179502), (142, 2, 'es', 1600673, 0.00828774788004407), ..

Download
< Zurück 1 2 Vorwärts >

Sie haben den gewünschten Datensatz nicht gefunden? Dann erstellen Sie doch einfach und kostenlos ein Datengesuch, damit ihnen Datenanbieter gezielt die benötigten Daten bereitstellen können.