AT-Statistiken II
hab mir vor dem schlafengehen nochmal das perl-buch rausgesucht und kurz ne weitere statistische analyse der amstertamm-postings gemacht. schließlich hab ich bei kaputtem laptop grade wenig möglichkeiten die zeit anders zu verbringen, visual studio läuft nich unter linux… also hiermit teil zwei: wortwahl.
es gibt drei listen pro person:
1. zehn häufigste wörter
2. zehn häufigste wörter über fünf buchstaben
3. zehn häufigste wörter über zehn buchstaben
hab bei der recherche erfahren dass im englischen “I” das in der gesprochenen sprache am häufigsten vorkommende wort ist; die vorliegenden ergebnisse bestätigen das auch für AT, was mich dann doch überrascht hat. bemüh ich mich doch arg darum nicht immer alle sätze mit “ich” anzufangen, hätt ich mir auch sparen können. ansonsten eh spannend: die vielen übereinstimmungen der einzelnen listen.
man beachte dass bei leuten mit weniger postings die plätzevergabe insbesondere bei längeren wörtern mit ner prise salz zu genießen ist. im prinzip sieht man da rauschen (usr’s “verschimmeln” z.b. hat er nur zwei mal gesagt). war auch erst überrascht darüber dass ich 22 mal “wechseljahre” gesagt haben soll, und dann wars einfach 22 mal im gleichen quatschposting.
und nen disclaimer: diverse verwendete software hatte ständig probleme mit umlauten; also keine gewähr für korrektheit.
wort-frequenz-analyse
klabusta:
1. ich und die ist das nicht der in auch mit
2. wieder einfach vielleicht machen ausserdem eigentlich hamburg berlin meinte gesehen
3. wahrscheinlich mittlerweile geschrieben letztendlich deutschland interessant interessiert programmiert programmieren irgendwelche
maggo:
1. ich die ist und das nicht du der mal auch
2. wieder einfach berlin übrigens werden vielleicht gerade natürlich machen kannst
3. wahrscheinlich tatsächlich interessant anstrengend geschrieben eingerichtet mittlerweile mitbekommen hoffentlich ausprobiert
mardön:
1. ich die und ist das der in nicht mit zu
2. wieder machen werden einfach vielleicht berlin gemacht können gesehen selbst
3. funktioniert anscheinend anforderung zeitüberschreitung wahrscheinlich interessant geschrieben freundschaft deutschland wechseljahre
oriba san:
1. ich die und das ist nicht der in aber auch
2. wieder vielleicht jemand eigentlich selbst gesehen gerade machen werden interessant
3. interessant wahrscheinlich funktioniert interessante deutschland irgendwelche entscheiden programmieren kulturbrauerei interessiert
suse:
1. ich und die ist das nicht der in aber du
2. eigentlich gerade wieder george gestern vielleicht einfach übrigens morgen nichts
3. wahrscheinlich französisch tatsächlich irgendwelche irgendjemand entscheidung mitgekriegt spätvorstellung installieren informatiker
usr:
1. ich und die ist das nicht der mit ein so
2. wieder eigentlich gerade werden machen einfach problem natürlich wissen wirklich
3. wahrscheinlich funktioniert mittlerweile geschrieben diplomarbeit beeindruckt anscheinend verschimmeln unbrauchbar thunderbird
7 Kommentare
wieso taucht “interessant” bei o. unter 2 und auch unter 3 auf? …neben “interessante” und “interessiert”
[ maggo am 10.2.2005 um 00:08 | # ]
na ist halt nen wort über zehn buchstaben das er öfter verwendet als viele kürzere.
[ mardön am 10.2.2005 um 10:21 | # ]
ok, aber stehen unter 2 nicht die wörter >5 und <10?
[ maggo am 10.2.2005 um 10:25 | # ]
nein. >5 hat mir gereicht.
[ mardön am 10.2.2005 um 10:38 | # ]
interessanterweise kommt “du” nur bei suse und maggo vor. “ich” hingegen bei allen als erstes. AT ist halt doch nur ein selbstdarstellungsforum…
[ oriba san am 10.2.2005 um 13:01 | # ]
Depression Depression Depression aaaaaaaa

HEEEEELP
I hate winter! I want summer!
[ DDDDepressionnnn am 21.11.2008 um 03:04 | # ]
I very much love summer


Someone very much loves winter
I Wish to know whom more
For what you love winter?
For what you love summer? Let’s argue
[ wintervssummer am 29.11.2008 um 16:11 | # ]
Kommentieren