Re: Εισαγωγή δεδομένων σε R commander
(Απαντώ και στη λίστα) 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr: Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά από excel και SPSS (προγράμματα κλειστού λογισμικού). 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών χαρακτήρων; Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο, αφού φορτωθεί. Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από μερικά χρόνια, http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει κάτι άλλο πιο πρόσφατο. Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση. Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται αλφαρηθμιτικά σε UTF-8. Οπότε, 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά. 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την τρέχουσα κατάσταση σχετικά με Unicode και R. Σίμος Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά, εμφανίζοντας μου σωστά και τα Ελληνικά. Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά σε Unicode (UTF-8). Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό πρόβλημα που έχουμε όπου τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση windows-1253/iso-8859-7, διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy encoding με τιμή windows-1253/iso-8859-7. Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3 tag), και αλλού. Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων. Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών είναι το κόμμα. Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε συμπεριφέρεται σωστά, μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό περιβάλλον, θα έχει ως διαχωριστικό την τελεία, ή να το αλλάξεις να είναι έτσι μόνο για το R. Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται, https://forum.ubuntu-gr.org/viewtopic.php?p=264305 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;) Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα. Το σύστημα φαίνεται να δουλεύει σωστά. Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο). Ευχαρστώ πολύ Σίμος -- Ubuntu-gr mailing list Ubuntu-gr@lists.ubuntu.com If you do not want to receive any more messages from the ubuntu-gr mailing list, please follow this link and choose unsubscribe: https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr
Σχετ: Εισαγωγή δεδομένων σε R commander
Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander (Απαντώ και στη λίστα) 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr: Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά από excel και SPSS (προγράμματα κλειστού λογισμικού). 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών χαρακτήρων; Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο, αφού φορτωθεί. Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από μερικά χρόνια, http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει κάτι άλλο πιο πρόσφατο. Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση. Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται αλφαρηθμιτικά σε UTF-8. Οπότε, 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά. 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την τρέχουσα κατάσταση σχετικά με Unicode και R. Σίμος Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά, εμφανίζοντας μου σωστά και τα Ελληνικά. Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά σε Unicode (UTF-8). Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό πρόβλημα που έχουμε όπου τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση windows-1253/iso-8859-7, διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy encoding με τιμή windows-1253/iso-8859-7. Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3 tag), και αλλού. Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων. Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών είναι το κόμμα. Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε συμπεριφέρεται σωστά, μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό περιβάλλον, θα έχει ως διαχωριστικό την τελεία, ή να το αλλάξεις να είναι έτσι μόνο για το R. Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται, https://forum.ubuntu-gr.org/viewtopic.php?p=264305 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;) Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα. Το σύστημα φαίνεται να δουλεύει σωστά. Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο). Ευχαρστώ πολύ Σίμος Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα. Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον μεταξύ unicode (UTF-8) και 1253/iso-8859-7. Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές: α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8) β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :) γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει) και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις Έτσι η λύση είναι είτε αυτή που αναφέρεται στο φορουμ, ή να είσαι προσεκτικός όταν πληκτρολογείς δεκαδικά, να βάζεις τελεία αντί για κόμμα. Άλλη λύση (δεν την έχω δουλέψει για να
Re: Εισαγωγή δεδομένων σε R commander
2012/10/14 Kostas Oikonomou kikono...@yahoo.gr Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω ότι έγινε με το SPSS. Και αυτό για δυο λόγους: 1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού. 2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS, να μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ ΝΟΜΙΜΟΣ. Δεν ξέρω αν βοηθάει καθόλου αυτό, αλλά ο μαθηματικός μας στο ChaniaLUG που ασχολείται μάλιστα με στατιστική χρησιμοποιεί το PSPP, που είναι σα να λέμε SPSS clone σε FOSS/Linux. Μπορεί να μην κάνει τα πάντα αλλά τουλάχιστον φαίνεται να ανοίγει γενικά τα αρχεία του SPSS και για τη δική του δουλειά γενικά έχει αποδειχθεί αρκετό, τουλάχιστον από ότι έχω καταλάβει. Χαιρετισμούς, Παντελής -- next part -- An HTML attachment was scrubbed... URL: https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/4301777b/attachment.html -- Ubuntu-gr mailing list Ubuntu-gr@lists.ubuntu.com If you do not want to receive any more messages from the ubuntu-gr mailing list, please follow this link and choose unsubscribe: https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr
Σχετ: Εισαγωγή δεδομένων σε R commander
Απο: Pantelis Koukousoulas pkt...@gmail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 5:29 μ.μ. Κυριακή, 14 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω ότι έγινε με το SPSS. Και αυτό για δυο λόγους: 1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού. 2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS, να μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ ΝΟΜΙΜΟΣ. Δεν ξέρω αν βοηθάει καθόλου αυτό, αλλά ο μαθηματικός μας στο ChaniaLUG που ασχολείται μάλιστα με στατιστική χρησιμοποιεί το PSPP, που είναι σα να λέμε SPSS clone σε FOSS/Linux. Μπορεί να μην κάνει τα πάντα αλλά τουλάχιστον φαίνεται να ανοίγει γενικά τα αρχεία του SPSS και για τη δική του δουλειά γενικά έχει αποδειχθεί αρκετό, τουλάχιστον από ότι έχω καταλάβει. Χαιρετισμούς, Παντελής Το PSPP αποτελεί μια αξιόπιστη πρόταση, που μάλιστα θα διευκολύνει τα μέγιστα τους χρήστες του SPSS. Να σημειώσω όμως ότι εξακολουθεί να έχει το πρόβλημα με την κωδικοποίηση των Ελληνικών χαρακτήρων. Στη προσπάθεια μου να δημιουργήσω ένα μικρό αρχείο με το πρόβλημα στα Ελληνικά (για να το ανεβάσω όπως μου ζήτησε ο Σίμος), είχα ξαναδοκιμάσει και το PSPP παράλληλα με το R commander. Εδώ να τονίσω ότι στην εισαγωγή του cvs αρχείου, ενώ στην προεπισκόπηση μου εμφάνιζε κανονικά τα Ελληνικά, μόλις έκλεινα το παράθυρο διαλόγου, αντί για Ελληνικά εμφανίζονταν αγγλικά ερωτηματικά «?». Στην άλλη άκρη, στο R commander τα Ελληνικά εμφανίζονταν κανονικά. Πιθανό εδώ να παίζει ρόλο και το ότι το PSPP είναι ακόμα σε έκδοση 1.0 και πιο συγκεκριμένα στην 0.7.9. Ελπίζω να προστεθεί και η δυνατότητα αλλαγής της κωδικοποίησης των χαρακτήρων. Τέλος να προσθέσω ότι κάνοντας αναζήτηση σε Ιατρικά περιοδικά, βρήκα άρθρα όπου αναφέρεται ότι η στατιστική ανάλυση έγινε με το R statistics. Ένα άρθρο που είδα ήταν σε περιοδικό με Impact factor 1,8. Και για όσους δεν έχουν σχέση με το Impact factor, να ενημερώσω ότι αυτός δείχνει την εγκυρότητα ενός περιοδικού. Πολλά περιοδικά δεν έχουν Impact factor. Ο μεγαλύτερος που υπάρχει στα περιοδικά της ειδικότητας της Καρδιολογίας είναι 10-11. Αυτός δείχνει πόσες φορές έχουν χρησιμοποιηθεί, σαν references, τα άρθρα του σε δημοσιεύσεις. Εν κατακλείδι, προσωπικά θεωρώ σαν πολύ καλή πρόταση το PSPP, αναμένοντας τη βελτίωση του. Μέχρι τότε, πιστεύω ότι αξίζει τον κόπο κάποιος να προσπαθήσει να μάθει το R commander (κι ας διαφέρει αρκετά από το πολύ γνωστό SPSS), γιατί είναι πιο πλήρες και επίσης αναγνωρισμένο. Διευκρινίζω και πάλι ότι αυτά αποτελούν προσωπικές απόψεις, που δεν σημαίνει ότι τις ασπάζονται και οι περισσότεροι. Φιλικά Κώστας Οικονόμου -- next part -- An HTML attachment was scrubbed... URL: https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/294be07c/attachment.html -- Ubuntu-gr mailing list Ubuntu-gr@lists.ubuntu.com If you do not want to receive any more messages from the ubuntu-gr mailing list, please follow this link and choose unsubscribe: https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr
Re: Εισαγωγή δεδομένων σε R commander
2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander (Απαντώ και στη λίστα) 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr: Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά από excel και SPSS (προγράμματα κλειστού λογισμικού). 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών χαρακτήρων; Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο, αφού φορτωθεί. Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από μερικά χρόνια, http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει κάτι άλλο πιο πρόσφατο. Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση. Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται αλφαρηθμιτικά σε UTF-8. Οπότε, 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά. 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την τρέχουσα κατάσταση σχετικά με Unicode και R. Σίμος Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά, εμφανίζοντας μου σωστά και τα Ελληνικά. Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά σε Unicode (UTF-8). Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό πρόβλημα που έχουμε όπου τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση windows-1253/iso-8859-7, διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy encoding με τιμή windows-1253/iso-8859-7. Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3 tag), και αλλού. Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων. Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών είναι το κόμμα. Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε συμπεριφέρεται σωστά, μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό περιβάλλον, θα έχει ως διαχωριστικό την τελεία, ή να το αλλάξεις να είναι έτσι μόνο για το R. Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται, https://forum.ubuntu-gr.org/viewtopic.php?p=264305 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;) Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα. Το σύστημα φαίνεται να δουλεύει σωστά. Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο). Ευχαρστώ πολύ Σίμος Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα. Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον μεταξύ unicode (UTF-8) και 1253/iso-8859-7. Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές: α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8) β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :) γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει) και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις (Είναι αρχεία «CSV», Comma Separated Values, και LibreOffice «Calc»). Το LibreOffice φαίνεται
Σχετ: Εισαγωγή δεδομένων σε R commander
Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 8:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander (Απαντώ και στη λίστα) 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr: Απο: Simos Xenitellis simos.li...@googlemail.com Προς: Kostas Oikonomou kikono...@yahoo.gr Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012 Θεμα: Re: Εισαγωγή δεδομένων σε R commander 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr: Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά από excel και SPSS (προγράμματα κλειστού λογισμικού). 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών χαρακτήρων; Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο, αφού φορτωθεί. Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από μερικά χρόνια, http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει κάτι άλλο πιο πρόσφατο. Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση. Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται αλφαρηθμιτικά σε UTF-8. Οπότε, 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά. 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την τρέχουσα κατάσταση σχετικά με Unicode και R. Σίμος Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά, εμφανίζοντας μου σωστά και τα Ελληνικά. Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά σε Unicode (UTF-8). Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό πρόβλημα που έχουμε όπου τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση windows-1253/iso-8859-7, διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy encoding με τιμή windows-1253/iso-8859-7. Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3 tag), και αλλού. Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων. Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών είναι το κόμμα. Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε συμπεριφέρεται σωστά, μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό περιβάλλον, θα έχει ως διαχωριστικό την τελεία, ή να το αλλάξεις να είναι έτσι μόνο για το R. Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται, https://forum.ubuntu-gr.org/viewtopic.php?p=264305 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;) Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα. Το σύστημα φαίνεται να δουλεύει σωστά. Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο). Ευχαρστώ πολύ Σίμος Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα. Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον μεταξύ unicode (UTF-8) και 1253/iso-8859-7. Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές: α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8) β. Διαχωριστής