Οι λέξεις έχουν τη δική τους ιστορία

Το ιστολόγιο του Νίκου Σαραντάκου, για τη γλώσσα, τη λογοτεχνία και… όλα τα άλλα

Ποια είναι τα τρία συχνότερα ουσιαστικά; – κουίζ στα «Κείμενα μαζί»

Posted by sarant στο 22 Ιουλίου, 2011


Έχουμε πολύ-πολύ καιρό να κάνουμε κουίζ στο ιστολόγιο, οπότε μόλις παρουσιάστηκε, χτες, η ευκαιρία, είπα να μην την αφήσω να περάσει έστω κι αν είναι καλοκαιριάτικη Παρασκευή σήμερα, κι έτσι η συμμετοχή θα είναι μειωμένη. Το σημερινό κουίζ έχει να κάνει με συχνές λέξεις και με σώματα κειμένων. Ο τίτλος είναι ελαφρώς ανακριβής για λόγους οικονομίας χώρου, θα εξηγηθώ πιο αναλυτικά εδώ. Αλλά ας πάρω τα πράγματα με τη σειρά.

Πριν από μερικές μέρες πήρα ένα ηλεμήνυμα στο οποίο ο  ερευνητής Γιώργος Κρητικός μού ζήτησε την άδεια να χρησιμοποιήσει το σώμα κειμένων «Κείμενα μαζί» που φιλοξενώ στον ιστότοπό μου για να φτιάξει έναν πίνακα με τη συχνότητα εμφάνισης  των λεκτικών τύπων σε ελληνικά κείμενα. Όπως μού είπε, δεν βρήκε άλλη τέτοια λίστα  στο Διαδίκτυο. Οι εφαρμογές της είναι πολλές, αλλά αυτό είναι θέμα για άλλη συζήτηση.

Να θυμίσω επιτροχάδην τι είναι τα «Κείμενα μαζί». Είναι μια συλλογή λογοτεχνικών κειμένων που δημιουργήθηκε ύστερα από δική μου πρωτοβουλία από αρκετούς εθελοντές συνεργάτες που ανταποκρίθηκαν στη σχετική πρόσκληση και πληκτρολογούσαν τα κείμενα που τους έστελνα ή διάλεγαν οι ίδιοι κείμενα και τα πρότειναν. Το εγχείρημα αυτό διάρκεσε δύο χρόνια, το 2008 και το 2009, και έδωσε μια αρκετά σημαντική, ποσοτικά και ποιοτικά, συλλογή λογοτεχνικών κειμένων, όσο κι αν δεν μπορούμε να πούμε ότι είναι αντιπροσωπευτικό δείγμα, μια και προέκυψε από συγκερασμό των προτιμήσεων -των δικών μου και των συνεργατών- αλλά και της διαθεσιμότητας των κειμένων. Πολλά κείμενα που ανεβάσαμε έχουν κοπιράιτ, αλλά ως τώρα δεν είχα καμιάν ενόχληση. Βέβαια, απέφευγα γνωστούς σύγχρονους συγγραφείς και έργα που εκδόθηκαν πρόσφατα. Η πρωτοβουλία αυτή σταμάτησε, δεν συνεχίζεται πια, αφενός επειδή έχει εξαντληθεί η χωρητικότητα του ιστότοπου που τη φιλοξενούσε και αφετέρου επειδή δεν έχω πια χρόνο να ασχοληθώ -φταίει και το ιστολόγιο που άνοιξα στο μεταξύ 🙂 Ωστόσο, το αποτέλεσμά της δεν είναι πιστεύω αμελητέο.

Τέλος πάντων, έγινε στατιστική ανάλυση σε αυτό το σώμα κειμένων (ύστερα από επεξεργασία, τις λεπτομέρειες της οποίας δεν ξέρω -για παράδειγμα, οι τύποι που είχαν εσφαλμένα μείνει άτονοι ενοποιήθηκαν με τους τονούμενους) και προέκυψε ένας πίνακας συχνότητας λέξεων -ή μάλλον, για να είμαι ακριβής, συχνότητας λεκτικών τύπων. Η λίστα αυτή αρχίζει ως εξής:

89739 και

70957 το

67646 να

59116 του

41422 ο

40264 τα

35982 την

34311 της

32654 η

31051 κι

Όπως περιμέναμε, στην πρώτη θέση είναι το «και» με 89.739 εμφανίσεις. Προσέξτε ότι το «κι» θεωρείται διαφορετικός λεκτικός τύπος, και έχει κι αυτό πολλές εμφανίσεις αφού βρίσκεται στη δέκατη θέση. Ο πίνακας, βέβαια, είναι μάλλον… βαρετός, μέχρι στιγμής, αφού απαρτίζεται αποκλειστικά από μονοσύλλαβες «αδρανείς» λέξεις (stop words τις λένε οι άγγλοι, δεν θυμάμαι πώς το λέμε εμείς στα ελληνικά). Πρέπει να φτάσουμε στην 22η θέση για να συναντήσουμε τον πρώτο ρηματικό τύπο (φυσικά το «είναι», με 11579 εμφανίσεις), ενώ δεν υπάρχει κανένα ουσιαστικό στην πρώτη πενηντάδα -το πρώτο ουσιαστικό βρίσκεται στην 52η θέση, ενώ στην πρώτη εκατοντάδα υπάρχουν μόνο άλλα δύο ουσιαστικά. Όλοι οι άλλοι λεκτικοί τύποι της πρώτης εκατοντάδας είναι αντωνυμίες, άρθρα, σύνδεσμοι, επιρρήματα, βοηθητικά ρήματα: μόλις τρία ουσιαστικά, ένα ή δυο ρήματα (εκτός από το είναι και το έχω), κανένα επίθετο! Φυσικά, αυτό είναι αναμενόμενο αλλά και πάλι εντυπωσιάζει να σκεφτούμε ότι οι λέξεις που δίνουν σάρκα στο λόγο (γιατί με το «και», το «δεν», το «που» και το «του» δεν μπορείς να πεις και πολλά πράγματα) είναι οι σπανιότερες.

Είπα όμως πολλά. Το κουίζ ξεκινάει. Σας ζητάω να μαντέψετε τα τρία συχνότερα ουσιαστικά στο σώμα κειμένων «Κείμενα μαζί». Ακριβέστερα, να βρείτε ποιοι είναι οι τρεις λεκτικοί τύποι που έχουν τις περισσότερες εμφανίσεις: διότι, όπως είπα, ο πίνακας δεν μετράει συχνότητα λημμάτων, αλλά λεκτικών τύπων. Για παράδειγμα, μετράει ξεχωριστά το «αχλάδι» από το «αχλάδια», το «αχλαδιού» ή το «αχλαδιών». Οπότε, θέλω από σας να μαντέψετε τους τρεις συχνότερους λεκτικούς τύπους όσον αφορά τα ουσιαστικά, π.χ. να πείτε:

1. άλογο
2. φρούτα
3. περιστέρι

Φυσικά, τα ουσιαστικά αυτά δεν είναι τα συχνότερα! Τα έβαλα για να δείξω ότι δεν είναι υποχρεωτικά όλοι οι λεκτικοί τύποι στην ονομαστική του ενικού.

Παρόλο που τα αποτελέσματα δεν προκαλούν έκπληξη όταν τα βλέπεις, είναι δύσκολο να τα προβλέψει κανείς (αν δεν έχει ασχοληθεί με ανάλυση σε σώματα κειμένων) γιατί είναι πάρα πολλές οι υποψήφιες λέξεις. Θα εκπλαγώ αν κάποιος βρει και τις τρεις συχνότερες λέξεις και μάλιστα με τη σειρά -αλλά δεν χάνετε τίποτα να δοκιμάσετε. Βέβαια, δεν έχω να υποσχεθώ πλούσια δώρα σε όποιον δώσει τη σωστότερη απάντηση, ο διαγωνισμός γίνεται για το ονόρε.

Να πω και τα τεχνικά. Ο διαγωνισμός θα διαρκέσει μερικές ώρες, ας πούμε 8 ώρες από τη δημοσίευσή του. Νικητής είναι όποιος βρει και τις τρεις λέξεις ή αλλιώς τις περισσότερες. Σε ισοβαθμία, νικητής είναι όποιος έχει τη σωστή σειρά ή όποιος την πλησιάσει περισσότερο. Σε νέα ισοβαθμία, νικητής είναι όποιος βρει και τον σωστό λεκτικό τύπο.

Λοιπόν, ποια είναι τα τρία συχνότερα ουσιαστικά;

Απάντηση

Οι τρεις συχνότεροι λεκτικοί τύποι  ουσιαστικών στη συλλογή «Κείμενα μαζί» είναι, κατά σειρά:

1. μάτια (προσοχή: στον πληθυντικό)

2. σπίτι

3. ώρα

Τρεις φίλοι μάντεψαν τις δύο από τις τρεις λέξεις, αλλά το πρώτο βραβείο δικαιωματικά πάει στον Ηλία (σχ. 5) που βρήκε και τη σωστή σειρά/θέση των λέξεων, μάντεψε στην πρώτη θέση τα μάτια και στην τρίτη την ώρα. Ο Δύτης (σχ. 12) και ο Στέλιος (σχ. 38) έχουν επίσης δύο σωστά, αλλά όχι στη σωστή θέση. Και ο Μιχάλης Νικολάου ψήφισε την επιλογή του Στέλιου. Παίρνουν έπαινο 🙂

Συγχαρητήρια και στους τέσσερις!

Ο Στάζιμπος βρήκε και τα τρία, αλλά χρησιμοποίησε απαγορευμένες ουσίες και ακυρώθηκε. Στην πραγματικότητα, δεν βρήκε μόνο τα τρία αλλά τα πρώτα δώδεκα (οι αριθμοί διαφέρουν από τη λίστα του Γ. Κρητικού, όχι όμως και η σειρά):

4010	μάτια
2782	σπίτι
2278	ώρα
2115	παιδί
2059	μέρα
1991	ζωή
1975	κεφάλι
1952	στιγμή
1898	χέρι
1827	χέρια
1815	φωνή
1769	παιδιά

Για να πω την αλήθεια, τα μάτια τα περίμενα, αλλά όχι το σπίτι  -θα έβαζα το χέρι. Αν υπολογίσουμε λήμματα και όχι λεκτικούς τύπους, το χέρι ξεπερνάει το σπίτι και τις ώρες, ενώ πολύ κοντά του βρίσκεται και το παιδί. Δηλαδή, αν υπολογίσουμε λήμματα, τότε το μάτι είναι πάντα πρώτο, και στη δεύτερη και τρίτη θέση έρχονται χέρι και παιδί (ή παιδί και χέρι, η διαφορά είναι πολύ μικρή).

Απροπό, πρώτο ρήμα στη λίστα (εκτός από τα είμαι και έχω) είναι το «λέω», με τον ρηματικό τύπο «λέει».

Αυτά και σας ευχαριστώ όλους για τη συμμετοχή!


Advertisements

125 Σχόλια to “Ποια είναι τα τρία συχνότερα ουσιαστικά; – κουίζ στα «Κείμενα μαζί»”

  1. 1. σπίτι
    2. μητέρας
    3. ημέρα

  2. Νέο kid στο block said

    1. αγάπη
    2.ημέρα
    3.έρωτας

  3. Θανάσης said

    Να δοκιμάσω κι εγώ την τυχη μου:

    1.χέρι
    2.κεφάλι
    3.παιδιά

  4. VasWho said

    σπίτι
    μάνα
    δουλειά

  5. Ηλιας said

    1.μάτια
    2.δουλειά
    3.ώρα

  6. 1. ΓΥΝΑΊΚΑ
    2. ΑΓΑΠΗ
    3. ΜΑΝΝΑ (σύμπτωση, και τα τρία θηλυκά!)

    Στην ελληνική μας στιχουργική, ειδικά την λαϊκή, «χέρι – μαχαίρι – περιστέρι». Κι ο συνηθέστερος επιιθετικός προσδιορισμός: «ραγισμένη καρδιά»..

    Αλλά, επιμένω, υπέροχε κ. Σαραντάκο, με αυτήν ξεκινούσα την διδασκαλία μου στα παιδιά της ομογενειακής παιδείας, η πιο ωραία ελληνική ονοματοποιΐα, είναι η «θάλασσα».

  7. sarant said

    Ευχαριστώ για τις πρώτες προσπάθειες! Προς το παρόν, δεν λέω τίποτε για να μην επηρεάσω την εξέλιξη του διαγωνισμού 🙂

  8. sarant said

    5: Με κολακεύετε 🙂

  9. AnD said

    1.αγάπη
    2. ζωή
    3. μάτια

  10. bernardina said

    ζωή
    έρωτας
    θάνατος

  11. ein Steppenwolf said

    Ώρα, δρόμος, φαΐ.

  12. παιδί
    μάτια
    σπίτια

  13. Hellegennes said

    1. κύριος
    2. Θεός
    3. μητέρα

    Αν και έπρεπε να έχουμε παραπάνω μαντεψιές. Τρεις για τρεις είναι άδικο 😦

  14. sarant said

    Το σκέφτηκα αυτό με τις παραπάνω μαντεψιές, αλλά το απέρριψα, ίσως κακώς. Τώρα όμως δεν μπορούμε να αλλάξουμε τους όρους του διαγωνισμού.

  15. τραπέζι
    άντρας
    θάλασσα

  16. HAL9000 said

    Καλημέρα σας

    1. χρόνια
    2. θέμα
    3. άνθρωποι

  17. Παλιό kid στο block said

    1.ανθρωπος
    2.πραγμα
    3.ζωη

  18. Δημήτρης Μ. said

    1. πρωί
    2. μέρα
    3. βράδυ

  19. sarant said

    Ευχαριστώ για τις μέχρι τώρα συμμετοχές!

    Η Εφορευτική Επιτροπή δηλώνει ότι διαπιστώθηκε μια ύποπτη περίπτωση διπλοψηφίας 😉

  20. Νέο kid στο block said

    Γάτα η εφορευτική! Γαμώτο….

  21. Ηλεφούφουτος said

    παιδί
    φίλο
    βράδυ

  22. Hellegennes said

    #20:
    Δεν ντρέπεσαι ρε αλήτη;

  23. Ηλεφούφουτος said

    Επειδή φαντάζομαι ότι και οι τύποι κύριος/κύριο θα είναι συχνοί, υπάρχει τρόπος να ξεκαθαρίζεται αν είναι επίθετα ή ουσιαστικά;

  24. bernardo said

    bad kid! shame on you!

  25. Νέο kid στο block said

    Μη βαράτε ρε παιδιά! ΛΕΦΤΑ ΥΠΑΡΧΟΥΝ!!

  26. sarant said

    23: Οι λέξεις που είχαν τις περισσότερες εμφανίσεις είναι σαφώς ουσιαστικά, χωρίς αμφισημίες.

  27. Γιώργος Λυκοτραφίτης said

    Σπίτι, μάνα, παιδιά…
    (αν και, συνήθως, χάνω στα κουίζ -μόνο;)…

  28. Άντε ας δοκιμάσω κι εγώ:

    1.ώρα
    2.μέρα
    3.λεφτά

  29. Νέο kid στο block said

    To λεφτά του Στέλιου δεν πιάνεται! εκλεψε την ιδέα απο το 25 🙂

  30. nikos__alfa said

    άνδρας
    ημέρα
    γυναίκα

  31. @29: ΧΑ! Ποιος μιλάει για κλοπές! Σε καταλάβαμε κύριος!! 🙂

  32. Soduck said

    – γυναίκα
    – φεγγάρι
    – νύχτα

    (πρόλαβα;)

  33. babis said

    1. ψωμί
    2. παιδεία
    3. ελευθερία

  34. sarant said

    Έχετε ακόμα δυο ώρες (και ένα τέταρτο) 🙂
    Και οι τρεις λέξεις έχουν ήδη αναφερθεί, αλλά όχι από το ίδιο άτομο.

    Μπορείτε να δοκιμάσετε και δεύτερη φορά.

  35. Andros said

    Θάλασσα
    Μάνα
    Παιδιά

  36. Vermeer said

    Γυναίκα
    Μητέρα
    Παιδί

  37. Νέο kid στο block said

    Μόλις μου έστειλε ένα μαίηλιον το Παλίο Kid στο Block ότι άδικα τον κατηγορήσατε και τον διασύρατε και ότι άτιμη κενωνία …κου λου που, κου λου που και κάτι τέτοια δακρύβρεχτα.
    Εγώ συντάσσομαι με την επίσημη γραμμή του φορέα διαχείρισης του ιστολογίου (σλουρπ,σλουρπ… σκουπίσου Νίκο…:-)) ότι έγινε απόπειρα διπλοψηφίας άρα όχι διπλοψηφία, άρα ξαναψηφίζω!
    1.Αγάπη
    2.Ζωή
    3.Ημέρα

  38. Άντε ας ξαναδοκιμάσω κι εγώ….. μετανιώνω για τα «λεφτά». Μάλλον με επηρέασε το #25 όντως. 🙂
    Λοιπόν, η νέα μου λίστα:

    1.ώρα
    2.σπίτι
    3.μέρα

  39. physicist said

    #37. Η δική μου ψήφος με σπέσιαλ αφιέρωση στα παιδιά του μπλοκ, παλιά και νέα: 🙂

    1. γάτα
    2. Σρέντινγκερ
    3. κουφάλα

  40. TAK said

    Θεός
    Γυναίκα
    Θάλασσα

  41. Νέο kid στο block said

    39. Καλά ρε φυσικέ, έχασες μια ψήφο για να με πεις …Σρέντινγκερ; Κορόιδο! 🙂

    ΥΓ. Προτείνω στην ανωτάτη διοίκηση παραχώρηση δίωρης παρατάσεως για να προλάβουν να ψηφίσουν Άγγελος, Κορνήλιος, ,Μπουκάν , M.Νικολάου,Τιπού, Μαρία,Bernardina και Ιμμόρ.
    (Η παράθεση των ονομάτων έγινε με κριτήριο πρώτα αγόρια μετά κορίτσια και όπως λάχει…)
    Τι διάολο, χωρίς αυτούς και αυτές, οι εκλογές είναι ομελέτα δίχως ωά. Ούτε πρωτοδικείο κατσικοχωρίου δε θα αναγνωρίσει τα αποτελέσματα…

  42. physicist said

    #41. Ε, δεν χάθηκε δα κι ο κόσμος, κάνω login σαν «νέος Φυσικός» (πώς λέμε «Νέος Πανιώνιος») και ξαναματαψηφίζω.

  43. Νέο kid στο block said

    41. Oυπςς! Η Berna έχει ψηφίσει , βγαινει απο τη λιστα αναμονής.

  44. Νέο kid στο block said

    42. O tempora o mores!

  45. Δημήτρης Μ. said

    1. δρόμος
    2. ήλιος
    3. φορά

  46. sarant said

    Η παράταση δόθηκε σιωπηρά, αλλά είναι Παρασκευή απόγευμα οπότε μάλλον θα λείπουν 🙂

  47. bernardina said

    Kidάκο,
    και ψήφισα και σε (ψευτο)μάλωσα υπογράφοντας ως bernardo, αλλά δεν προσέχεις, δεν προσέχεις και με στεναχωρείς!

    Κύριε, κύριε, να ξαναψηφίσω; 👿

  48. Νέο kid στο block said

    46.Mα καλά δεν τους έχεις προμηθεύσει ακόμη με μηλόφωνα (Ι-phones) ώστε να είναι παντού και πάντα on-line; Κρίση και στο Großherzogtum; 🙂

  49. sarant said

    Είπαμε, μπορούμε να δώσουμε και δεύτερη ψήφο αφού πάρουμε υπόψη ότι οι τρεις λέξεις έχουν ήδη προταθεί (όχι από ένα άτομο)

  50. μάτια
    ώρα
    παιδί

  51. Alexis said

    μάτια
    νύχτα
    ζωή

  52. Νέο kid στο block said

    Καλά, τωρα παρατηρώ οτι ούτε ο LandS εχει ψηφίσει!!
    Κάπως έτσι θα γίνουν μου φαίνεται οι επόμενες βουλευτικές στην Ελλάδα.
    Θα βγαίνουν οι δικαστικοί αντιπρόσωποι στο δρόμο και θα λένε: ‘περάστε μέσα ρε παιδιά ,κερνάμε και τυρόπιτα!’’
    🙂

  53. Ηλεφούφουτος said

    δεύτερη προσπάθεια:

    παιδί
    δρόμο
    φίλο

  54. Συγγνώμη, μου διέφυγε το σπίτι

    μάτια
    σπίτι
    ώρα

  55. μὰμ
    κακὰ
    νάνι
    😛

  56. bernardina said

    ξαναδοκιμάζω

    άνθρωποι
    κόσμος
    μέρα

    Τι ώρα κληρώνει, αφεντικό; Πρέπει να φύγω σε λίγο και έχω αγωνία 😆

    Καλέ, αυτή η Ιμόρ που είναι; Και γιατί χρονοτριβεί σε διπλανά ποστια ο Κορνήλιος;

  57. bernardina said

    Μαζί γράφαμε 😆

  58. Άλλη μια ψήφο στο 38.

  59. babis said

    ψωμί
    ελιά
    κωτσοβασιλιά

  60. spoiler: Η δωδεκάδα που μέτρησα πρόχειρα.

  61. Καλέ, αυτή η Ιμόρ που είναι; Και γιατί χρονοτριβεί σε διπλανά ποστια ο Κορνήλιος;

    γιατί εἶναι οἱ βάρβαροι νὰ φτάσουν σήμερα. 😛

  62. Νέο kid στο block said

    Eεεε, κύριε Stazybo! To ντόπινγκ είναι ποινικό αδίκημα!

  63. 60,
    Πώς το κάνεις το μαγικό;

  64. sarant said

    Στάζιμπε, κλέβεις!

  65. μὴ τὸν πολυζορίζετε τὸν Στάζυβο γιατί δὲν τὄχει καὶ σὲ τίποτε νὰ βγάλῃ τοὺς τίτλους καὶ τὶς ἡμερομηνές τῶν 12 ἑπομένων νημάτων γιὰ τὸ ἱστολόγιο κάθε θαμῶνος. ἄ!

  66. #63 Ε, πήρε κανά δίωρο…
    #64 😳 Βγάλε το λίκνο, αφού δεν αντέχουν στον πειρασμό και τον πατάνε

  67. sarant said

    Μα, έτσι κι αλλιώς θα ανακοίνωνα τα αποτελέσματα.

  68. sarant said

    Απάντηση στον διαγωνισμό

    Οι τρεις συχνότεροι λεκτικοί τύποι ουσιαστικών στη συλλογή «Κείμενα μαζί» είναι, κατά σειρά:

    1. μάτια (προσοχή: στον πληθυντικό)

    2. σπίτι

    3. ώρα

    Τρεις φίλοι μάντεψαν τις δύο από τις τρεις λέξεις, αλλά το πρώτο βραβείο δικαιωματικά πάει στον Ηλία (σχ. 5) που βρήκε και τη σωστή σειρά/θέση των λέξεων, μάντεψε στην πρώτη θέση τα μάτια και στην τρίτη την ώρα. Ο Δύτης (σχ. 12) και ο Στέλιος (σχ. 28) έχουν επίσης δύο σωστά, αλλά όχι στη σωστή θέση. Παίρνουν έπαινο 🙂

    Συγχαρητήρια και στους τρεις!

    Ο Στάζιμπος βρήκε και τα τρία, αλλά χρησιμοποίησε απαγορευμένες ουσίες και ακυρώθηκε. Στην πραγματικότητα, δεν βρήκε μόνο τα τρία αλλά τα πρώτα δώδεκα (οι αριθμοί διαφέρουν από τη λίστα του Γ. Κρητικού, όχι όμως και η σειρά):

    4010 μάτια
    2782 σπίτι
    2278 ώρα
    2115 παιδί
    2059 μέρα
    1991 ζωή
    1975 κεφάλι
    1952 στιγμή
    1898 χέρι
    1827 χέρια
    1815 φωνή
    1769 παιδιά
    Για να πω την αλήθεια, τα μάτια τα περίμενα, αλλά όχι το σπίτι -θα έβαζα το χέρι. Αν υπολογίσουμε λήμματα και όχι λεκτικούς τύπους, το χέρι ξεπερνάει το σπίτι και τις ώρες, ενώ πολύ κοντά του βρίσκεται και το παιδί. Δηλαδή, αν υπολογίσουμε λήμματα, τότε το μάτι είναι πάντα πρώτο, και στη δεύτερη και τρίτη θέση έρχονται χέρι και παιδί (ή παιδί και χέρι, η διαφορά είναι πολύ μικρή).

    Απροπό, πρώτο ρήμα στη λίστα (εκτός από τα είμαι και έχω) είναι το «λέω», με τον ρηματικό τύπο «λέει».

    Αυτά και σας ευχαριστώ όλους για τη συμμετοχή!

  69. bernardina said

    Φτου! Τζίφος και στις δύο προσπάθειες. Αλλά δεν πειράζει, κερδίζω στην αγάπη, χεχε
    Συγχαρητήρια στους νικητές. Πάντα τέτοια!

    Άντε, καληνυχτίζω και φεύγω τρέχοντας γιατί τους έστησα εξαιτίας σας, ξεμυαλίστρες. 🙂 Τα ξαναλέμε

  70. sarant said

    Μεγάλη μας τιμή, να έχεις στήσει κόσμο εξαιτίας μας 🙂

  71. Το 60 το έβαλα για να αυτοακυρωθώ και για να προτείνω εμμέσως το Pastebin Add-on για μικροκείμενα (ή κώδικα, φυσικά) που χρειάζεται να δείξετε σε (ή να συνδιαμορφώσετε με) τρίτους.

    #63 Μιχάλη, αν και είχα ήδη κατεβασμένο όλο το sarantakos.com, ξανακατέβασα ό,τι ήταν «κείμενα μαζί», τα έκανα text και τα ένωσα. Μετά ήταν πολύ ζέστη για κώδικα, οπότε έχασα χρόνο σε γκούγκλισμα για αρκετά σκάρτα, προτού πέσω σ’ αυτό. Με κατάλληλο μασάζ στο αρχείο εισόδου (αφαίρεση τύπων του ενός και των δύο χαρακτήρων, σπάσιμο του κειμένου σε γραμμή και τύπο, αλφαβητική ταξινόμηση, και σπάσιμο σε δέκα αρχεία, χωρίς να χωρίζουν οι εμφανίσεις ενός τύπου σε δυο αρχεία) ξεπέρασα τους περιορισμούς της δοκιμαστικής έκδοσης.

  72. 68,
    Η απάντηση του Στέλιου που παίρνει έπαινο δεν είναι το σχ. 28 (στο οποίο «λεφτά» υπάρχουν) αλλά το σχ. 38 (χωρίς λεφτά), που επίσης ψήφισα. 🙂

  73. 71,
    Ευχαριστώ! Έχει αρκετή δουλειά, λοιπόν.

  74. Δόξα καὶ τιμὴ στὸν νέο μας προφήτη
    ποὺ βρῆκε καὶ τὰ μάτια ποὺ βρῆκε καὶ τὸ σπίτι
    ποὺ βρῆκε καὶ τὴν ὥρα κι ἡ Ἰεζάβελ κράζει:
    «τοῦ Βάαλ τι ἀπέγινε ὁ ἱερεάς Στάζυ;»

  75. Νέο kid στο block said

    Μα καλά, η αγάπη ούτε καν στη ντουζίνα;
    …Και μετά σου λένε ερωτικός λαός…πφφφ! Μη γκρινιάζουμε για την υπογεννητικότητα.
    ΥΓ.Και σκέφτηκα κάποια στιγμή τι να εννοεί ο ποιητής Σαράντ με το 8. , αλλά με μπέρδεψε η …γιαούρτη (λέγε με Μπέρτραντ)
    ΥΓ2. Συγχαρητήρια στους διακριθέντες!

  76. sarant said

    Μιχάλη, δίκιο έχεις, διορθώνω!

  77. Νέο kid στο block said

    Πες όμως και κάνα ευχαριστώ κύριε Νικολάου για τη παρατασούλα που αιτήθηκα (41.) και που χάριν αυτής ,κέρδισες την δόξα και τιμή! 🙂 🙂

  78. Βεβαίως, η συμβολή της παράτασης υπήρξε αποφασιστική στην ομαλή διεξαγωγή του αγώνα!

  79. ein Steppenwolf said

    Να ένα προγραμματάκι για Linux που μετρά τη συχνότητα των λέξεων:

    lynx -dump -nolist \
    $(lynx -dump -listonly -nonumbers \
    http://www.sarantakos.com/keimenamazi.html \
    http://www.sarantakos.com/kibwtos/mazi/ |
    egrep ‘\.(htm|html)$’ |
    egrep ‘/(kibwtos|liter)/’ |
    sort |
    uniq) |
    gawk ‘
    { $0 = tolower(gensub(/[^Α-ΩΆΈΉΊΌΎΏΪΫ α-ωάέήίόύώϊϋΐΰ]/, » «, «g»)); }
    { for (ii = 1; ii <= NF; ++ii) ++nn[$ii]; }
    END { for (ww in nn) printf("%5i\t%s\n", nn[ww], ww); }
    ' |
    sort -nr;

    Βγάζει την ίδια δεκάδα συχνότερων τύπων με του ερευνητή και την ίδια ντουζίνα συχνότερων τύπων με του ερευνητή και του Stazybo, αν και οι απόλυτες συχνότητες διαφέρουν κάπως.

  80. sarant said

    Ωχ, ευτυχώς που δεν είμαστε όλοι προγραμματιστές… δεν θα μπορούσα να κάνω κουίζ 🙂

  81. @79: Steppenwolf φαντάζομαι θα αντιλαμβάνεσαι ότι μετά από αυτό το σχόλιο είσαι ο Θεός μου, ε; 😀

    Ρε παιδιά ο μόνος είμαι που το «μάτια» δεν του πήγε καθόλου στο μυαλό για συχνότατης χρήσης λέξη; Τι στο καλό; πόσο συχνά λέμε μάτια;

  82. ἐγὼ κατάλαβα ὅτι κάλλιο νὰ σοῦ βγῇ τὸ μάτι παρὰ τὸ πρόγραμμα!

  83. sarant said

    81: Για τα ωραία σου τα μάτια, για τα μάτια του κόσμου, μάτια μου. Δεν θέλω να σε ξαναδώ στα μάτια μου, μαύρα μάτια κάναμε να σε δούμε. Έπεσες πολύ στα μάτια μου μ’ αυτό που έκανες. Δεν πίστευα στα μάτια μου.

  84. ein Steppenwolf said

    81: Ευχαριστώ!

  85. τὰ μάτια μοῦ δίνουν 32.4000.000 γουγλίσματα. τὸ μάτι 21.900.000 ἀλλὰ δὲν ξέρω ἂν ὄντως στὰ γουγλίσματα τῶν ματιῶν δὲν συμπεριλαμβάνεται καὶ τὸ μάτι καὶ τὸ ἀντίστροφο.

  86. παρόραμα: 32.400.000

  87. τὰ χέρια μοῦ δίνουν πάντως 48.200.000

  88. Νέο kid στο block said

    Φάτε μάτια ψάρια !

  89. Νέο kid στο block said

    Καλά να πάθω, που δεν πιστεύω στο Synchronicity του Γιουνγκ.
    Την ώρα περίπου που έδινα την δεύτερη (ή τρίτη; Χι,χι,χι…) ψήφο, το σκυλί της μικρής μου κόρης τραγουδούσε ‘Μάτια ,χέρια, πόδια και κοιλιά…’ ή κάτι τέτοιο ,ξέρετε ίσως αυτό το σκυλί που το ζουλάς και τραγουδάει, μαθαίνοντας σου την ανατομία.

  90. babis said

  91. @89: Βρε ΝεοΚιντ είσαι μπαμπάς; Πόσο είσαι;

  92. Νέο kid στο block said

    Μικροπαντρεύτηκα Στέλιο μου. 🙂

  93. Νέο kid στο block said

    Μπράβο ρε Μπάμπη!! Αντιγράφω για τον Νταλγκά κάποια βιογραφικά όπως τα γραψε ένα φιλαράκι σε κάποιο ‘πεθαμένο’ τώρα μπλογκ και ως εκ τούτου, μη άξιο αναφοράς.
    ‘’Γεννήθηκε το 1892 στο προάστιο Αρναούκιοϊ της Κωνσταντινούπολης. Το κανονικό του όνομα ήταν Αντώνης Διαμαντίδης, τον έβγαλαν Νταλγκά λόγω του πάθους του και των γυρισμάτων που έκανε η φωνή του. Καταγόταν από εύπορη οικογένεια, ο πατέρας του ήταν ράφτης στη συνοικία Ισκουτάρ, στην ασιατική πλευρά της Κωνσταντινούπολης. Έτσι κατάφερε ο Νταλγκάς να τελειώσει το σχολείο, μιλούσε αγγλικά και γαλλικά και αυτό του επέτρεψε να ταξιδεύει με τα υπερωκεάνια που πήγαιναν στην Αμερική και να τραγουδά με την ορχήστρα του καραβιού. Μορφωμένος λοιπόν και με αστικούς τρόπους, ο Νταλγκάς ανέβηκε γρήγορα τη μουσική κλίμακα όσον αφορά τη φήμη του. Οι Τούρκοι σήμερα τον θεωρούν τον σπουδαιότερο, μαζί με τον Χαβίζ Μπουρχάν, έναν άλλο, Τούρκο τραγουδιστή. Το 1922, ενώ ταξίδευε με το υπερωκεάνιο «Βασιλεύς Αλέξανδρος» μαθαίνει τα νέα για τη μικρασιατική καταστροφή και εγκαθίσταται με την οικογένειά του μόνιμα στην Ελλάδα, στον Πειραιά αρχικά και αργότερα στα Πετράλωνα. Στην Ελλάδα αρχίζει να εργάζεται ως τραγουδιστής ή μουσικός σε διάφορα κέντρα με Σμυρνέικα, λαϊκά, και ρεμπέτικα συγκροτήματα. Μετά το 1933, και ενώ έχει ήδη εγκαταλείψει το ούτι και παίζει κιθάρα, εξαφανίζεται από τη δισκογραφία και αρχίζει να εμφανίζεται σε διάφορες αριστοκρατικές ταβέρνες τραγουδώντας ελαφρά (καντάδες, ρομάντζες, επιθεωρησιακά κ.λ.π.) τραγούδια. Συνεχίζει τις εμφανίσεις του μέχρι το 1941. Με την είσοδο των Γερμανών στην Αθήνα, εγκαταλείπει το πάλκο, βυθίζεται στη μελαγχολία και πεθαίνει τελικά στις αρχές του 1945.’’

  94. Νέο kid στο block said

    Αφιερωμένο σε όλα τα κορίτσια του ιστολογίου.

  95. ein Steppenwolf said

    94: Μα τι ωραίο τραγούδι!

  96. babis said

  97. Έπαινο ο Δύτης! Ωωωω! Είμαι πολύ συγκινημένος.

  98. ein Steppenwolf said

    Απροπό, πρώτο ρήμα στη λίστα (εκτός από τα είμαι κι έχω) είναι το “λέω”, με τον ρηματικό τύπο “λέει”.

    Δεν είναι ο τύπος «είπε»;

  99. Ιδού και δύο online εργαλεία για αυτή τη δουλειά:

    Το wordle.net φτιάχνει ωραία συννεφάκια με τις συχνότερες λέξεις ενός κειμένου, π.χ. δες εδώ

    http://www.wordle.net/show/wrdl/3865944/%CE%A4%CE%BF_%CF%84%CE%B1%CE%BE%CE%AF%CE%B4%CE%B9_%CE%BC%CE%BF%CF%85%2C_%CE%93._%CE%A8%CF%85%CF%87%CE%AC%CF%81%CE%B7%CF%82

    («Το ταξίδι μου» του Γ. Ψυχάρη)

    Στο http://voyeur.hermeneuti.ca/ υπάρχουν εργαλεία για αυτή τη δουλειά. Ιδού το ίδιο κείμενο εκεί:
    http://voyeur.hermeneuti.ca/?corpus=1311368113345.727

  100. #98
    12812 είναι
    9553 είχε
    5786 είπε
    3488 ήτανε
    2943 έχει
    2597 ήτο
    2220 λέει
    1825 είχαν
    1534 μπορεί
    1512 κάνει
    1461 είδε
    1460 έκανε
    1412 έλεγε
    1376 είχα
    1365 πάει
    1350 ήθελε
    1324 λες
    1260 ήρθε
    1235 πήρε

    #99 Νότη, το tagxedo που χρησιμοποιήσαμε την πρωτοχρονιά είναι κλάσεις ανώτερο από το wordle.

  101. sarant said

    Πράγματι, το «είπε» είναι συχνότερο -θυμόμουνα λάθος!

  102. ein Steppenwolf said

    100:
    Σου ξέφυγε το «πρέπει» μεταξύ του «είχαν» και του «μπορεί»!

  103. sarant said

    99-100: Ο Στάζιμπος εννοεί αυτό:
    https://sarantakos.wordpress.com/2011/01/03/%CF%84%CE%BF-2010-%CF%83%CF%84%CE%BF-%CE%B9%CF%83%CF%84%CE%BF%CE%BB%CF%8C%CE%B3%CE%B9%CE%BF/

    Καθόλου περίεργο, που στο wordle του Ταξιδιού βγαίνει περίοπτη η λέξη «γλώσσα»!

  104. Immortalité said

    Άντε πια, όλα τα καλά τα χάνω.
    Όχι ότι θα τα ‘βρισκα δηλαδή. Και σιγά που δεν θα τα ‘βρισκε ο Στάζυ! 🙂

    @94 Διπλοτριπλοψηφίσαντα, το ένα από τα κορίτσια σ’ ευχαριστεί για την αφιέρωση 😉

    Και μια και τα «μάτια» ήρθαν πρώτα,

  105. Hellegennes said

    Ψέματα. Είναι όλα ψέματα. Νοθεία, αλητεία, ΠΑΣΟΚ! Δεν συμμετέχω ξανά σε κουίζ γιατί παίζουν ζαβολιάρηδες που μετράνε λέξεις, ψηφίζουν με διπλές περσίδες, αραβίδες, πώς-στο-καλό-λέγονται…

    και δεν μπορεί τα μάτια να είναι τόσο συχνή λέξη. Είναι όλα ψεύδη και νοθείες του κυρίου Σαραντάκου του οποίου τα κίνητρά είναι ζοφερά, σκοτεινά, τενάγεια, βαλτώδη, βούρκινα, τελματωμένα και σκαιώδη και θέλει να μας παρασύρει σε έναν βδελυρό, απεχθή, ειδεχθή, ποταπό, ιταμό, ουτιδανό, ατελέσφορο, υποβολιμαίο, υστερόβουλο, ανείπωτο, κακοτράχαλο δρόμο, που μέλλει να σφάξει το μέλλον της γλώσσης, της πατρίδος, της ηθικής, της ψυχής, της ελευθερίας, της αγάπης, της ελπίδας, της αξιοκρατίας, της πεπλατυφύλλου αγκαλίας.

    Γαμώτο, πάλι έχασα.

  106. Immortalité said

    Γαμώτο, πάλι έχασα.

    Μήπως ν’ αρχίζεις να το συνηθίζεις; 😀

  107. 2597 ήτο

    αὐτὸ πρέπεοι νὰ ἑορτασθῇ μὲ ἄφθονον καμπανίτην οἶνον!

    νὰ βάλω ἀκόμη ἕνα ἀγαπημένο μου:

  108. Immortalité said

    @107 2597 ήτο (;;;)

    αὐτὸ πρέπει νὰ ἑορτασθῇ μὲ ἄφθονον καμπανίτην οἶνον! (το ποιο;)

    @61 Σε μια υπόγα που δεν έπιανε το μηλαράκι του 48 😦

    @66-2 Τον έβαλες για να μας δοκιμάσεις; 😉

  109. 107 apud 108 ὅρα 100

  110. #100, #103 π.χ. http://www.tagxedo.com/art/67c358a0aee54351

  111. #102 Το πρέπει το παρέλειψα ως άκλιτο…

  112. sarant said

    `107: Έχουμε πολύ Παπαδιαμάντη στο σώμα κειμένων, εξού και το ήτο.

  113. Hellegennes said

    #112:

    Α-χα! Νοθεία, αίσχος, αιδώς, ντροπή, όνειδος, αισχύνη, απαπά.

  114. ΣΑΘ said

    @ 105

    Εξαιρετικό !!!

    Είχα χρόνια να γελάσω όπως γέλασα διαβάζοντας το αμίμητο :
    «Νοθεία, αλητεία, ΠΑΣΟΚ!»

    ΥΓ:

    Γιατί όχι ‘τενάγιος’ (κατά το πελάγιος) ;

    Καλημέρα σας.

  115. Νέο kid στο block said

    ‘Νοθεία, αλητεία!’ στο σαραντάκειο μπλογκ
    ελάλησε ο Ελλη και πήρε ένα γκλομπ
    Βαρά ζερβά ,βαρά δεξά και κράζει τους πασόκους
    Μα στάσου λίγο ρε παιδί, πληρώνουνε και τόκους.

    Είχε Παπαδιαμάντη, πολύν και βαρετόν*
    Ήτο και εγένετο και ήκουα και ωών.
    ‘μετ’ έρωτος την φύσιν ‘…ως κάτι λατρευτόν
    Των λέξεων ιστορία, κρατάει το αφεντικόν 🙂

    Μα έρως και αγάπες ουδόλως δεν υπήρχαν
    Στου στάζιμπου την έξυπνη την κορυφαία λίσταν

    Μάτια και σπίτια, ω! τι πεζό, που ήταν το πρωτείο
    Ακόμη και ο Στέλιος μας ,πήρε ένα βραβείο! 🙂

    Μα η διαδικασία θολερή, πλείστες και οι ενστάσεις
    Η Ιμόρ μας δεν εψήφισε κι άρχισε τις εντάσεις 🙂

    Μα και ο Κορνής ο θαλερός ,των στιχοπλόκων θρύλος,
    για μαμ και νάνι μίλησε και εκκένωσης… φιλίες…
    Παλιονιοκίντ διπλό(τριπλό) φηφίσας έγινε γραικύλος,
    Και όλα καλά και ανθηρά , πάμε για παραλίες!!

    *Βαρετός= βαρύς στο κυπριακό ιδίωμα.

  116. Νιοκιντ ορθώς περιέγραψες την διαδικασία
    δικαίως κι ο Ελληγενής φωνάζει για νοθεία
    στους στίχους σου όμως νιώθω, παρόλη τη σοφία
    ότι σαφώς υφίσταται μια φοβερή αβλεψία!

    Μα ούτε μια αναφορά στου Λίνουξ το Θεό;
    Τον Steppenwolf που έφτιαξε το σκριπτ το μαγικό;
    Εγώ από χθες θαυμάζω τον άρτιο κώδικά του
    όσα κι αν τον πληρώνουνε, τ’αξίζει τα λεφτά του!

    Κι αν τώρα λίγο φαίνεται ότι τον Steppen γλύφω
    δεν είναι που στις εκλογές θα του γυρέψω ψήφο.

    Απλά τυγχάνει και εγώ να είμαι του τομέα,
    κι αν χρειαστώ βοήθεια στα σέα και τα μέα
    του Λίνουξ τα μυστήρια, στου σκρίπτινγκ τους δαιδάλους
    στον Steppenwolf θα απευθυνθώ, και δεν θα ψάξω άλλους!

  117. Κι αφού είπα και ελάλησα, και πήρα τα βραβεία
    ευχαριστώ επιτροπή, μαμά μπαμπά και θεία,
    τώρα θα μου επιτρέψετε αγαπητά παιδία
    βάζω μαγιό, αντηλιακά και τρέχω παραλία!

  118. Ἀχιλλέας Τζάλλας said

    105 Θαυμάσιον ! (ξεχάσατε ὅτι τὰ κίνητρα εἶναι βορβορώδη, ἐκτὸς τῶν ἄλλων…)

  119. Hellegennes said

    #114, 118:

    Ευχαριστώ 🙂

    Γιατί τενάγειος και όχι τενάγιος; Δεν ξέρω, έτσι μού βγήκε. Τα βορβορώδη μού διέφυγαν. Ήτο και η ώρα δύσκολη.

  120. ein Steppenwolf said

    116: Να ‘σαι καλά!

  121. νέο kid στο block said

    Νέε καλέ και ευγενή , γενναίε Στυλιανέ
    Προσεκτικός να διατελείς, ως και στον καφενέ

    Μήπως και πάρει μυρωδιά της χώρας ο αστρίτης*,
    τις πλείστες όσες αρετές, τα τόσα σου βραβεία
    και εφορία αποσταλεί, σαν να ’σουνα κοπρίτης
    Ράμπο και Σδόε και μπατσικά να ερίσουν για πρωτεία.

    Ποιος θα πρωτοφανεί για να εξιχνιάσει
    τα έπαθλα που απέκτησες, να πάρει να ζυγιάσει
    και δίκαια φορολογικά, βάρη να σου προσάψει!

    Όσο δε για τον κώδικα, του Λίνουξ το σκριπτάκι
    Για να το λες εσύ, φρονώ θα ειν’ τεφαρικάκι!

    Είσαι παιδί με σεβασμό και με αρχές συνάμα
    Που θειά μπαμπά δε ξέχασες, μα ούτε και τη μάμα!
    Πάνω στον κολοφώνα σου, της δόξης τον μεγάλο,
    δώσε και μας τους άτυχους, κάνα καλό ρεγάλο!

    Και αν θες ευγνώμων να φανείς, στον λύκο τον της στέπας,
    το κοπυράιτ να σεβαστείς, να μη σε πιάσει ο Ρέππας!

    Αυτά τα ολίγα είχα να πω, πέριξ της παραλίας
    μα το Wi-Fi μου λειψό, στις βάσεις της Αγγλίας
    Μα να το δείλι φάνηκε, σε λίγο θα ‘μαι σπίτι!
    Τη λέξη που σε ανέδειξε, και το δυφίο… μπίτι!

    *αστρίτης= είδος οχιάς, λέγεται μεταφορικά στο χωριό μου για τον έξυπνο και τάχιστο μεν όχι και τόσο καλοπροαίρετο δε και κάπως αχόρταγο άνθρωπο. Ο ποιητής εδώ, μάλλον εννοεί κάποιον υπουργό οικονομικών ή κάποιον τέτοιον τέλος πάντων…

  122. sarant said

    Ωραίος ο διάλογος 🙂

  123. παπαΣτρούμφ said

    Οι 100 συχνότερες λέξεις του εθεγ.
    …και ένα προγραμματάκι για να μετράτε λέξεις σε ό,τι κείμενο θέλετε.

  124. sarant said

    Ευχαριστούμε πολύ!

    Το λινκ δεν βγάζει κατευθείαν (τουλάχιστον εμένα), πρέπει να πατήσεις «Στατιστικά». Πολύ ενδιαφέρον όμως.
    Το σώμα του ΕΘΕΓ είναι κατά πλειοψηφία από εφημερίδες, οπότε βγάζει παρόμοια αποτελέσματα ως προς τις «άδειες» λέξεις αλλά εντελώς διαφορετικά ως προς τα ουσιαστικά, αφού δίνει πρώτα:
    χρόνια
    θέμα
    Ελλάδα
    κυβέρνηση

  125. Σωστά το έπιασε:

    Για χρόνια
    το θέμα
    με την Ελλάδα
    είναι η κυβέρνηση.
    🙂

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση /  Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση /  Αλλαγή )

Σύνδεση με %s

 
Αρέσει σε %d bloggers: