________________________________
 Απο: Simos Xenitellis <simos.li...@googlemail.com>
Προς: Kostas Oikonomou <kikono...@yahoo.gr> 
Κοιν.: Ubuntu Λίστα <ubuntu-gr@lists.ubuntu.com> 
Στάλθηκε: 8:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
Θεμα: Re: Εισαγωγή δεδομένων σε R commander
 
2012/10/14 Kostas Oikonomou <kikono...@yahoo.gr>:
>
>
> ________________________________
> Απο: Simos Xenitellis <simos.li...@googlemail.com>
> Προς: Kostas Oikonomou <kikono...@yahoo.gr>
> Κοιν.: Ubuntu-gr <Ubuntu-gr@lists.ubuntu.com>
> Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
>
> Θεμα: Re: Εισαγωγή δεδομένων σε R commander
>
> (Απαντώ και στη λίστα)
>
> 2012/10/14 Kostas Oikonomou <kikono...@yahoo.gr>:
>>
>>
>> ________________________________
>> Απο: Simos Xenitellis <simos.li...@googlemail.com>
>> Προς: Kostas Oikonomou <kikono...@yahoo.gr>
>> Κοιν.: Ubuntu Λίστα <ubuntu-gr@lists.ubuntu.com>
>> Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
>> Θεμα: Re: Εισαγωγή δεδομένων σε R commander
>>
>> 2012/10/13 Kostas Oikonomou <kikono...@yahoo.gr>:
>>>
>>> Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
>>> χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει
>>> το
>>> πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
>>> από excel και SPSS (προγράμματα κλειστού λογισμικού).
>>>
>>>
>>> 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
>>> χαρακτήρων;
>>
>> Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
>> στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
>> βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
>> δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
>> αφού φορτωθεί.
>>
>> Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
>> μερικά χρόνια,
>> http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
>> Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
>> κάτι άλλο πιο πρόσφατο.
>> Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.
>>
>> Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
>> υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
>> αλφαρηθμιτικά σε UTF-8.
>>
>> Οπότε,
>> 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
>> εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
>> 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
>> τρέχουσα κατάσταση σχετικά με Unicode και R.
>>
>> Σίμος
>>
>>
>> Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
>> δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
>> το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
>> Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
>> εμφανίζοντας μου σωστά και τα Ελληνικά.
>>
>
> Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
> σε Unicode (UTF-8).
> Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
> πρόβλημα που έχουμε όπου
> τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
> windows-1253/iso-8859-7,
> διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
> encoding με τιμή windows-1253/iso-8859-7.
>
> Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
> tag), και αλλού.
>
>> Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου
>> κάποιο
>> πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα
>> ότι
>> έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το
>> ότι
>> σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
>> την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
>> κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.
>>
>
> Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
> είναι το κόμμα.
> Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
> συμπεριφέρεται σωστά,
> μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
> περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
> ή να το αλλάξεις να είναι έτσι μόνο για το R.
>
> Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
> https://forum.ubuntu-gr.org/viewtopic.php?p=264305
>
> Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
> αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)
>
>> Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο
>> πρόβλημα.
>> Το σύστημα φαίνεται να δουλεύει σωστά.
>>
>> Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
>> πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
>> να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).
>>
>> Ευχαρστώ πολύ
>>
>
> Σίμος
>
> Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα.
>
> Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον
> μεταξύ unicode (UTF-8) και 1253/iso-8859-7.
>
> Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις
> την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές:
> α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8)
> β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :)
> γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει)
> και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις
>

(Είναι αρχεία «CSV», Comma Separated Values, και LibreOffice «Calc»).

Το LibreOffice φαίνεται να ακολουθεί τη ρύθμιση γλώσσας του
συστήματος, οπότε έχει ως προεπιλογή να χρησιμοποιεί , για τους
δεκαδικούς, όταν το περιβάλλον είναι ελληνικό.

Οπότε, αν έχεις νούμερα με κόμμα ως διαχωριστικό στα δεκαδικά, τότε
θέλει προσοχή στην εξαγωγή ως CSV, διότι η προεπιλογή είναι το κόμμα
για το διαχωρισμό των πεδίων.

> Έτσι η λύση είναι είτε αυτή που αναφέρεται στο φορουμ, ή να είσαι
> προσεκτικός όταν πληκτρολογείς δεκαδικά, να βάζεις τελεία αντί για κόμμα.
> Άλλη λύση (δεν την έχω δουλέψει για να ξέρω τι προβλήματα παρουσιάζει, είναι
> να αλλάξεις το διαχωριστικό των πεδίων από κόμα σε tab ή κάτι άλλο).
>

Αν το έγγραφό σου έχει ήδη δεκαδικούς με τον ένα ή τον άλλο τρόπο,
είναι σημαντικό να είναι ο ίδιος τρόπος (τελεία ή κόμμα) σε όλο το
έγγραφο. Αν υπάρχει πρόβλημα, κτλ, μπορεί να φτιαχτεί με κάποια
μακροεντολή.
Θα έλεγα να αποφύγεις την κατάσταση να χρειαστεί να γράφεις με π.χ.
τελεία ενώ το σύστημα είναι ρυθμισμένο να αναμένει το κόμμα ως
διαχωριστικό στους δεκαδικούς.
Σε Ubuntu μπορείς να έχεις ελληνικό περιβάλλον και να θέσεις τη
μεταβλητή LC_MONETARY στο αγγλικό (οπότε τελεία για τους δεκαδικούς).
Σε Windows μάλλον γίνεται μέσα από τις ρυθμίσεις του LibreOffice
(προτιμήσεις).

> Τώρα για το αρχείο που ήδη δουλεύω και δεν περνά στο R commander δεν ξέρω
> ποιο ακριβώς είναι το πρόβλημα. Πρόκειται για ένα πολύ μεγάλο αρχείο με 161
> περιστατικά, όπου κάθε περιστατικό έχει 240 πεδία. Πολλά πεδία είναι κενά
> λόγω έλλειψης δεδομένων. Πιστεύω ότι αυτό πρέπει να δημιουργεί το πρόβλημα.

Τυπικά ένα μεγάλο αρχείο μπορείς να το μικρύνεις για να εντοπίσεις που
ακριβώς έχει πρόβλημα.
Αν υπάρχει κάποιο αρχείο που έχει πρόβλημα, στείλε με σε προσωπικό
μαζί με εντολές για το τι να κάνω ώστε να φανεί εκείνο το πρόβλημα
κωδικοποίησης.

> Όπως και να έχει το θέμα, ήδη επεξεργάζομαι το αρχείο σε SPSS και θα ήταν
> πρόβλημα να ξαναξεκινήσω την επεξεργασία από την αρχή. Η ερώτηση έγινε
> κυρίως για μελλοντική χρήση. Όταν θα χρειαστώ να ξανακάνω στατιστική ανάλυση
> να ξέρω ότι τα δεδομένα περνάνε στο R commander, για να το χρησιμοποιήσω.
>
> Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η
> στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω
> ότι έγινε με το SPSS. Και αυτό για δυο λόγους:
>
> 1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού.
> 2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS, να
> μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ ΝΟΜΙΜΟΣ.
>
> Και πάλι σας ευχαριστώ πολύ.
>

Σίμος


Ευχαριστώ Σίμο για την προσφορά σου να αναλύσεις το αρχείο, αλλά δεν 
χρειάζεται. Όπως ανέφερα θα τελειώσω αυτό που κάνω συνεχίζοντας να χρησιμοποιώ 
το SPSS, δυστυχώς στα Windows. Θα ήταν πολύ μεγάλη ταλαιπωρία και μεγάλος 
φόρτος εργασίας να ξαναξεκινήσω από την αρχή.

Στην επόμενη εργασία μου που θα χρειαστώ στατιστική ανάλυση, αν έχω πρόβλημα 
στο να περάσω τα στοιχεία μου στο R commander θα ζητήσω βοήθεια έγκαιρα.

Φιλικά

Κώστας Οικονόμου
-------------- next part --------------
An HTML attachment was scrubbed...
URL: 
<https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/28db780b/attachment.html>
-- 
Ubuntu-gr mailing list
Ubuntu-gr@lists.ubuntu.com

If you do not want to receive any more messages from the ubuntu-gr mailing 
list, please follow this link and choose unsubscribe:
https://lists.ubuntu.com/mailman/listinfo/ubuntu-gr

Απαντηση