Re: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Simos Xenitellis
(Απαντώ και στη λίστα)

2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr:

 Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
 χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το
 πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
 από excel και SPSS (προγράμματα κλειστού λογισμικού).


 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
 χαρακτήρων;

 Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
 στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
 βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
 δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
 αφού φορτωθεί.

 Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
 μερικά χρόνια,
 http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
 Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
 κάτι άλλο πιο πρόσφατο.
 Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.

 Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
 υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
 αλφαρηθμιτικά σε UTF-8.

 Οπότε,
 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
 εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
 τρέχουσα κατάσταση σχετικά με Unicode και R.

 Σίμος


 Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
 δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
 το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
 Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
 εμφανίζοντας μου σωστά και τα Ελληνικά.


Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
σε Unicode (UTF-8).
Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
πρόβλημα που έχουμε όπου
τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
windows-1253/iso-8859-7,
διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
encoding με τιμή windows-1253/iso-8859-7.

Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
tag), και αλλού.

 Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο
 πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι
 έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι
 σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
 την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
 κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.


Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
είναι το κόμμα.
Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
συμπεριφέρεται σωστά,
μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
ή να το αλλάξεις να είναι έτσι μόνο για το R.

Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
https://forum.ubuntu-gr.org/viewtopic.php?p=264305

Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)

 Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα.
 Το σύστημα φαίνεται να δουλεύει σωστά.

 Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
 πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
 να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).

 Ευχαρστώ πολύ


Σίμος
-- 
Ubuntu-gr mailing list
Ubuntu-gr@lists.ubuntu.com

If you do not want to receive any more messages from the ubuntu-gr mailing 
list, please follow this link and choose unsubscribe:
https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr


Σχετ: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Kostas Oikonomou





 Απο: Simos Xenitellis simos.li...@googlemail.com
Προς: Kostas Oikonomou kikono...@yahoo.gr 
Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com 
Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
Θεμα: Re: Εισαγωγή δεδομένων σε R commander
 
(Απαντώ και στη λίστα)

2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr:

 Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
 χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το
 πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
 από excel και SPSS (προγράμματα κλειστού λογισμικού).


 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
 χαρακτήρων;

 Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
 στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
 βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
 δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
 αφού φορτωθεί.

 Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
 μερικά χρόνια,
 http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
 Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
 κάτι άλλο πιο πρόσφατο.
 Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.

 Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
 υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
 αλφαρηθμιτικά σε UTF-8.

 Οπότε,
 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
 εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
 τρέχουσα κατάσταση σχετικά με Unicode και R.

 Σίμος


 Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
 δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
 το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
 Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
 εμφανίζοντας μου σωστά και τα Ελληνικά.


Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
σε Unicode (UTF-8).
Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
πρόβλημα που έχουμε όπου
τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
windows-1253/iso-8859-7,
διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
encoding με τιμή windows-1253/iso-8859-7.

Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
tag), και αλλού.

 Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο
 πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι
 έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι
 σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
 την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
 κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.


Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
είναι το κόμμα.
Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
συμπεριφέρεται σωστά,
μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
ή να το αλλάξεις να είναι έτσι μόνο για το R.

Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
https://forum.ubuntu-gr.org/viewtopic.php?p=264305

Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)

 Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα.
 Το σύστημα φαίνεται να δουλεύει σωστά.

 Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
 πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
 να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).

 Ευχαρστώ πολύ


Σίμος

Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα.

Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον 
μεταξύ unicode (UTF-8) και 1253/iso-8859-7.

Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις την 
κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές:
α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8)
β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :)
γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει)
και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις

Έτσι η λύση είναι είτε αυτή που αναφέρεται στο φορουμ, ή να είσαι προσεκτικός 
όταν πληκτρολογείς δεκαδικά, να βάζεις τελεία αντί για κόμμα. Άλλη λύση (δεν 
την έχω δουλέψει για να

Re: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Pantelis Koukousoulas
2012/10/14 Kostas Oikonomou kikono...@yahoo.gr

 Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η
 στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω
 ότι έγινε με το SPSS. Και αυτό για δυο λόγους:

 1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού.
 2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS,
 να μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ
 ΝΟΜΙΜΟΣ.


Δεν ξέρω αν βοηθάει καθόλου αυτό, αλλά ο μαθηματικός μας
στο ChaniaLUG που ασχολείται μάλιστα με στατιστική χρησιμοποιεί
το PSPP, που είναι σα να λέμε SPSS clone σε FOSS/Linux. Μπορεί να
μην κάνει τα πάντα αλλά τουλάχιστον φαίνεται να ανοίγει γενικά τα
αρχεία του SPSS και για τη δική του δουλειά γενικά έχει αποδειχθεί
αρκετό, τουλάχιστον από ότι έχω καταλάβει.

Χαιρετισμούς,
Παντελής
-- next part --
An HTML attachment was scrubbed...
URL: 
https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/4301777b/attachment.html
-- 
Ubuntu-gr mailing list
Ubuntu-gr@lists.ubuntu.com

If you do not want to receive any more messages from the ubuntu-gr mailing 
list, please follow this link and choose unsubscribe:
https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr


Σχετ: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Kostas Oikonomou





 Απο: Pantelis  Koukousoulas pkt...@gmail.com
Προς: Kostas Oikonomou kikono...@yahoo.gr 
Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com 
Στάλθηκε: 5:29 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
Θεμα: Re: Εισαγωγή δεδομένων σε R commander
 




2012/10/14 Kostas Oikonomou kikono...@yahoo.gr

Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η 
στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω ότι 
έγινε με το SPSS. Και αυτό για δυο λόγους:

1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού.
2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS, να 
μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ ΝΟΜΙΜΟΣ.


Δεν ξέρω αν βοηθάει καθόλου αυτό, αλλά ο μαθηματικός μας
στο ChaniaLUG που ασχολείται μάλιστα με στατιστική χρησιμοποιεί
το PSPP, που είναι σα να λέμε SPSS clone σε FOSS/Linux. Μπορεί να
μην κάνει τα πάντα αλλά τουλάχιστον φαίνεται να ανοίγει γενικά τα
αρχεία του SPSS και για τη δική του δουλειά γενικά έχει αποδειχθεί
αρκετό, τουλάχιστον από ότι έχω καταλάβει.

Χαιρετισμούς,
Παντελής

Το PSPP αποτελεί μια αξιόπιστη πρόταση, που μάλιστα θα διευκολύνει τα μέγιστα 
τους χρήστες του SPSS. Να σημειώσω όμως ότι εξακολουθεί να έχει το πρόβλημα με 
την κωδικοποίηση των Ελληνικών χαρακτήρων.

Στη προσπάθεια μου να δημιουργήσω ένα μικρό αρχείο με το πρόβλημα στα Ελληνικά 
(για να το ανεβάσω όπως μου ζήτησε ο Σίμος), είχα ξαναδοκιμάσει και το PSPP 
παράλληλα με το R commander. Εδώ να τονίσω ότι στην εισαγωγή του cvs αρχείου, 
ενώ στην προεπισκόπηση μου εμφάνιζε κανονικά τα Ελληνικά, μόλις έκλεινα το 
παράθυρο διαλόγου, αντί για Ελληνικά εμφανίζονταν αγγλικά ερωτηματικά 
«?». Στην άλλη άκρη, στο R commander τα Ελληνικά εμφανίζονταν κανονικά. 
Πιθανό εδώ να παίζει ρόλο και το ότι το PSPP είναι ακόμα σε έκδοση 1.0 και πιο 
συγκεκριμένα στην
 0.7.9. Ελπίζω να προστεθεί και η δυνατότητα αλλαγής της κωδικοποίησης των 
χαρακτήρων.

Τέλος να προσθέσω ότι κάνοντας αναζήτηση σε Ιατρικά περιοδικά, βρήκα άρθρα όπου 
αναφέρεται ότι η στατιστική ανάλυση έγινε με το R statistics. Ένα άρθρο που 
είδα ήταν σε περιοδικό με Impact factor 1,8. Και για όσους δεν έχουν σχέση με 
το Impact factor, να ενημερώσω ότι αυτός δείχνει την εγκυρότητα ενός 
περιοδικού. Πολλά περιοδικά δεν έχουν  Impact factor. Ο μεγαλύτερος που υπάρχει 
στα περιοδικά της ειδικότητας της Καρδιολογίας είναι 10-11. Αυτός δείχνει πόσες 
φορές έχουν χρησιμοποιηθεί, σαν references, τα άρθρα του σε δημοσιεύσεις.

Εν κατακλείδι, προσωπικά θεωρώ σαν πολύ καλή πρόταση το PSPP, αναμένοντας τη 
βελτίωση του. Μέχρι τότε, πιστεύω ότι αξίζει τον κόπο κάποιος να προσπαθήσει να 
μάθει το R commander (κι ας διαφέρει αρκετά από το πολύ γνωστό SPSS), γιατί 
είναι πιο πλήρες και επίσης αναγνωρισμένο. Διευκρινίζω και πάλι ότι αυτά 
αποτελούν προσωπικές απόψεις, που δεν σημαίνει ότι τις ασπάζονται και οι 
περισσότεροι.

Φιλικά

Κώστας Οικονόμου
-- next part --
An HTML attachment was scrubbed...
URL: 
https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/294be07c/attachment.html
-- 
Ubuntu-gr mailing list
Ubuntu-gr@lists.ubuntu.com

If you do not want to receive any more messages from the ubuntu-gr mailing 
list, please follow this link and choose unsubscribe:
https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr


Re: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Simos Xenitellis
2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012

 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 (Απαντώ και στη λίστα)

 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr:

 Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
 χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει
 το
 πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
 από excel και SPSS (προγράμματα κλειστού λογισμικού).


 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
 χαρακτήρων;

 Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
 στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
 βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
 δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
 αφού φορτωθεί.

 Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
 μερικά χρόνια,
 http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
 Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
 κάτι άλλο πιο πρόσφατο.
 Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.

 Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
 υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
 αλφαρηθμιτικά σε UTF-8.

 Οπότε,
 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
 εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
 τρέχουσα κατάσταση σχετικά με Unicode και R.

 Σίμος


 Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
 δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
 το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
 Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
 εμφανίζοντας μου σωστά και τα Ελληνικά.


 Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
 σε Unicode (UTF-8).
 Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
 πρόβλημα που έχουμε όπου
 τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
 windows-1253/iso-8859-7,
 διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
 encoding με τιμή windows-1253/iso-8859-7.

 Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
 tag), και αλλού.

 Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου
 κάποιο
 πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα
 ότι
 έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το
 ότι
 σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
 την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
 κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.


 Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
 είναι το κόμμα.
 Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
 συμπεριφέρεται σωστά,
 μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
 περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
 ή να το αλλάξεις να είναι έτσι μόνο για το R.

 Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
 https://forum.ubuntu-gr.org/viewtopic.php?p=264305

 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
 αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)

 Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο
 πρόβλημα.
 Το σύστημα φαίνεται να δουλεύει σωστά.

 Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
 πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
 να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).

 Ευχαρστώ πολύ


 Σίμος

 Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα.

 Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον
 μεταξύ unicode (UTF-8) και 1253/iso-8859-7.

 Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις
 την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές:
 α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8)
 β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :)
 γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει)
 και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις


(Είναι αρχεία «CSV», Comma Separated Values, και LibreOffice «Calc»).

Το LibreOffice φαίνεται

Σχετ: Εισαγωγή δεδομένων σε R commander

2012-10-14 ϑεμα Kostas Oikonomou





 Απο: Simos Xenitellis simos.li...@googlemail.com
Προς: Kostas Oikonomou kikono...@yahoo.gr 
Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com 
Στάλθηκε: 8:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
Θεμα: Re: Εισαγωγή δεδομένων σε R commander
 
2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu-gr Ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012

 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 (Απαντώ και στη λίστα)

 2012/10/14 Kostas Oikonomou kikono...@yahoo.gr:


 
 Απο: Simos Xenitellis simos.li...@googlemail.com
 Προς: Kostas Oikonomou kikono...@yahoo.gr
 Κοιν.: Ubuntu Λίστα ubuntu-gr@lists.ubuntu.com
 Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
 Θεμα: Re: Εισαγωγή δεδομένων σε R commander

 2012/10/13 Kostas Oikonomou kikono...@yahoo.gr:

 Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
 χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει
 το
 πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
 από excel και SPSS (προγράμματα κλειστού λογισμικού).


 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
 χαρακτήρων;

 Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
 στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
 βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
 δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
 αφού φορτωθεί.

 Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
 μερικά χρόνια,
 http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
 Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
 κάτι άλλο πιο πρόσφατο.
 Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.

 Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
 υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
 αλφαρηθμιτικά σε UTF-8.

 Οπότε,
 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
 εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
 τρέχουσα κατάσταση σχετικά με Unicode και R.

 Σίμος


 Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
 δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
 το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
 Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
 εμφανίζοντας μου σωστά και τα Ελληνικά.


 Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
 σε Unicode (UTF-8).
 Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
 πρόβλημα που έχουμε όπου
 τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
 windows-1253/iso-8859-7,
 διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
 encoding με τιμή windows-1253/iso-8859-7.

 Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
 tag), και αλλού.

 Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου
 κάποιο
 πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα
 ότι
 έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το
 ότι
 σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
 την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
 κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.


 Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
 είναι το κόμμα.
 Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
 συμπεριφέρεται σωστά,
 μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
 περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
 ή να το αλλάξεις να είναι έτσι μόνο για το R.

 Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
 https://forum.ubuntu-gr.org/viewtopic.php?p=264305

 Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
 αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)

 Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο
 πρόβλημα.
 Το σύστημα φαίνεται να δουλεύει σωστά.

 Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
 πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
 να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).

 Ευχαρστώ πολύ


 Σίμος

 Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα.

 Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον
 μεταξύ unicode (UTF-8) και 1253/iso-8859-7.

 Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις
 την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές:
 α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8)
 β. Διαχωριστής