AT-Statistiken II

hab mir vor dem schlafengehen nochmal das perl-buch rausgesucht und kurz ne weitere statistische analyse der amstertamm-postings gemacht. schließlich hab ich bei kaputtem laptop grade wenig möglichkeiten die zeit anders zu verbringen, visual studio läuft nich unter linux… also hiermit teil zwei: wortwahl.

es gibt drei listen pro person:
1. zehn häufigste wörter
2. zehn häufigste wörter über fünf buchstaben
3. zehn häufigste wörter über zehn buchstaben

hab bei der recherche erfahren dass im englischen “I” das in der gesprochenen sprache am häufigsten vorkommende wort ist; die vorliegenden ergebnisse bestätigen das auch für AT, was mich dann doch überrascht hat. bemüh ich mich doch arg darum nicht immer alle sätze mit “ich” anzufangen, hätt ich mir auch sparen können. ansonsten eh spannend: die vielen übereinstimmungen der einzelnen listen.

man beachte dass bei leuten mit weniger postings die plätzevergabe insbesondere bei längeren wörtern mit ner prise salz zu genießen ist. im prinzip sieht man da rauschen (usr’s “verschimmeln” z.b. hat er nur zwei mal gesagt). war auch erst überrascht darüber dass ich 22 mal “wechseljahre” gesagt haben soll, und dann wars einfach 22 mal im gleichen quatschposting.

und nen disclaimer: diverse verwendete software hatte ständig probleme mit umlauten; also keine gewähr für korrektheit.

wort-frequenz-analyse

klabusta:
1. ich und die ist das nicht der in auch mit
2. wieder einfach vielleicht machen ausserdem eigentlich hamburg berlin meinte gesehen
3. wahrscheinlich mittlerweile geschrieben letztendlich deutschland interessant interessiert programmiert programmieren irgendwelche

maggo:
1. ich die ist und das nicht du der mal auch
2. wieder einfach berlin übrigens werden vielleicht gerade natürlich machen kannst
3. wahrscheinlich tatsächlich interessant anstrengend geschrieben eingerichtet mittlerweile mitbekommen hoffentlich ausprobiert

mardön:
1. ich die und ist das der in nicht mit zu
2. wieder machen werden einfach vielleicht berlin gemacht können gesehen selbst
3. funktioniert anscheinend anforderung zeitüberschreitung wahrscheinlich interessant geschrieben freundschaft deutschland wechseljahre

oriba san:
1. ich die und das ist nicht der in aber auch
2. wieder vielleicht jemand eigentlich selbst gesehen gerade machen werden interessant
3. interessant wahrscheinlich funktioniert interessante deutschland irgendwelche entscheiden programmieren kulturbrauerei interessiert

suse:
1. ich und die ist das nicht der in aber du
2. eigentlich gerade wieder george gestern vielleicht einfach übrigens morgen nichts
3. wahrscheinlich französisch tatsächlich irgendwelche irgendjemand entscheidung mitgekriegt spätvorstellung installieren informatiker

usr:
1. ich und die ist das nicht der mit ein so
2. wieder eigentlich gerade werden machen einfach problem natürlich wissen wirklich
3. wahrscheinlich funktioniert mittlerweile geschrieben diplomarbeit beeindruckt anscheinend verschimmeln unbrauchbar thunderbird

Es können Kommentare hinterlassen werden. Pings sind nicht erlaubt.

7 Kommentare

  • wieso taucht “interessant” bei o. unter 2 und auch unter 3 auf? …neben “interessante” und “interessiert” ;)

  • na ist halt nen wort über zehn buchstaben das er öfter verwendet als viele kürzere.

  • ok, aber stehen unter 2 nicht die wörter >5 und <10?

  • nein. >5 hat mir gereicht.

  • interessanterweise kommt “du” nur bei suse und maggo vor. “ich” hingegen bei allen als erstes. AT ist halt doch nur ein selbstdarstellungsforum… ;-)

  • Depression Depression Depression aaaaaaaa
    HEEEEELP :( :( :(
    I hate winter! I want summer!

  • I very much love summer :)
    Someone very much loves winter :(
    I Wish to know whom more :)
    For what you love winter?
    For what you love summer? Let’s argue :)

Kommentieren