Re: [DX] DX-lehtiä annataan / digitointi
ilkka suni is@pp.inet.fi kirjoitti 30.9.2013 kello 23.48: Hienoa, Pasi, että päivitit tilannetta. Mutta. Eihän prosessi todellisuudessa voi olla noin työläs ja vaikea, eihän? 73, IS Ei ole rakettitiedettä, skannasin kokeeksi vuoden 2010 lehden kokonaan ja aikaa meni tunti. Irroitin niitit ja skannasin sivun kerrallaan. Pdf:ssä kannet väreissä, muuten mustavalko asetus 300dpi. Hakemistoon laitoin kirjanmerkit artikkeleihin, helpompi hyppiä haluamiinsa juttuihin. Kokoa tuli 5.5mb eli suoritus välttävä. Mustavalkoisena tekstistä saa paremmin selvää, kuvista ei niinkään. Harmaasävyinä taas kuvat näkyy paremmin mutta tekstit haaleat. Testasin yhdellä kansisivulla tiedoston kokoa, värisivu 410kb harmaasävy 254kb ja mustavalko 130kb. KTU___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan / digitointi
Mikä oli se firma ja minkä hintainen oli tuo lehtiskanneri (rak. sarja?)? Itellä olisi käyttöä kun on sadoittain eli tuhansittain lehtiä jotka voisi sakannata.. 73,s IJL ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan / digitointi
Terve Ilpo ja muutkin, Kirjaskannerin Eurooppa-version info löytyy tarpeellisine tietoineen täältä: http://diybookscanner.eu/home.html. Kauppaavat kahta mallia, kalliimman kanssa tulee kaksi Canonin halvemman pään A810-kameraa tykötarpeineen. Heijastamattomat lasit joutuu metsästämään itse. Olikin yllättävän lujan takana löytää myyjä, mutta onnekkaasti sitten loppukesällä tärppäsi, kun naapurissa Keravalla oli eräälle lasiliikkeelle jäänyt ylijäämäerä 6-7 vuoden takaa tällaista tyyppiä: http://www.hy-tech-glass.ch/en/products/anti-reflective-glass/luxar/product- information-luxar.html, mutta kuuleman mukaan Schott Mirogard 3 or 4mm is the best you can find at a decent price. Itse rakennussarja oli tehty hyvin mitoilleen Latviassa, josta oli toimituskin. Se vain, että kun olivat mokomat sitten maalanneet vanerit mattamustiksi heijastusten pienentämiseksi, niin eivätpä olleet toleransseissa enää ja käytännössä kaikki limittäin menevät osat joutui hiomaan uudelleen maalittomiksi... Puuosat pystyisi teettämään itsekin, zip-file osien mitoista löytyy ensimmäisen linkin alta. Tämä mainos on ollut näytillä sivulla jo pian puoli vuotta: COMING SOON: diybookscanner standalone, no software configuration necessary, eli ei taida ihan pian tulla... Täällä lisää EU-puuhamiehen (Linux-fani) ohjeistusta: https://github.com/markvdb/diybookscanner/wiki. Vaikuttaa siltä, että kehittäjien yleinen mielenkiinto on siirtymässä Spreads-ohjelmaan: https://github.com/jbaiter/spreads/. Jos Ilpo ajelet Keski-Uudellamaalla, niin ota yhteyttä; laite seisoo arkipäivät pitkät autotallissa käyttäjää odottamassa... Kiinnostusta se on kyllä herättänyt. Jahka tosiaan saan zoom- ja exposure -asetukset kohdalleen ilmeisimmin CHDK-skriptissä, niin ainakin kameran muistikorteille asti alkavat kuvat sujuvasti päätyä. Teoreettinen kuvausnopeus on 150-300 sivua tunnissa, mutta saas nähdä. Niin, jos lasketaan 50 vuoden ajalle 10 lehteä per vuosi ja keskimäärin vaikka 50 sivua, saadaan luku 25000. Ei ihan mahdoton määrä porukallakaan tehtäväksi. Kysymys on lopulta siitä miten korkealle tai matalalle kunnianhimon rima katsotaan sopivaksi asettaa. JKT:tä mukaillakseni, toivottavasti emme ole tekemässä näitä vain itsellemme. Siksi täytyy kiinnittää huomiota myös materiaalin yhtenäisyyteen ja arkistokelpoisuuteen. Toki voidaan tehdä usean tason tallenteita eri käyttötarkoituksiin, sillä mm. tiedostokoko määrittää pitkälle, miten nopeasti sivut verkon kautta latautuvat. Nyky-RM:n perus-PDF-versiot ovat olleet n. 2-4 Mbyteä per lehti smallest file size -asetuksilla. Arkistokelpoinen PDF/A on ainakin tuplaten tämä. Kuvitteellisesti, kukapa tietää, vaikka joku 2100-luvun avaruussään tutkija ei tämän käytännönläheisempää tietoa mistään muualtakaan löydä n. vuosina 1920-2020 käytetystä AM-antiikkimodulaatiosta tai sitä lyhytikäisemmäksi jääneestä FM-modulaatiosta ;-) Koska kyse on tosiaan yli puolen vuosisadan lehtien tallentamisesta, niin yritetään hakea parhaat menettelytavat hankkeeseen eikä ainakaan turhalla hätäilyllä ajeta hommaa kiville... Kaikenlaiset näkemykset asiasta ovat tervetulleita! t. PRI Date: Tue, 1 Oct 2013 10:12:12 +0300 (EEST) From: Ijl ijl@...i To: Suomalaisten DX-lista dx@hard-core-dx.com Subject: Re: [DX] DX-lehtiä annataan / digitointi Mikä oli se firma ja minkä hintainen oli tuo lehtiskanneri (rak. sarja?)? Itellä olisi käyttöä kun on sadoittain eli tuhansittain lehtiä jotka voisi sakannata.. 73,s IJL Ei ole vaikeaa, mutta pirun iso työmäärä siinä on. Yli 50 vuodessa on ehditty tuottaa tuhansia DX-lehden sivuja. Ennen offsetpainovaihetta tehtyjen lehtien painojälki on aika surkea ja varsinkin OCR vaatii melkoisesti aikaa sekä ihmisen silmää ja aivoja ohjelman tuottaman tekstin korjailussa. Jos tyydytään pelkkiin alkuperäissivujen kopioihin (ilman tekstin hakumahdollisuutta), työ on tietysti paljon pienempi. Offset-lehdissä isoin homma on ilmeisesti juuri tuo tekstin ja harmaasävykuvien yhteensovittaminen, josta Kari kertoo. Epäilen vahvasti, että ainoa keino on jyrkentää skannattujen sivujen sävyjä jokseenkin mustavalkoisiksi sen jälkeen kun sivulla olevat harmaasävykuvat on ensin poistettu valinnasta. Tämä on aika helppo toimenpide sopivalla kuvankäsittelyohjelmalla, mutta vaatii työtä. Millään toistokäyrän manipuloinnilla se ei onnistu ilman, että tekstin selkeytys vaikuttaisi myös harmaasävykuviin. ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan
Oikaisu: LWC, eikä mikään glossy. Siis painopaperi. Joo. 73, IS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Museovehkeillä reaaliajassa. Ei laiskaa persepuuhaamista. ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan
At 10:30 29.9.2013, you wrote: Hei! Olen kuulunut luultavasti vuodet 1967-2009 Suomen DX-liittoon ( ja edeltäjiin ). Jäsennumeroni on 800. Tuolta ajalta kaikki lehdet pitäisi olla tallessa. Nyt olen niitä kantamassa pihan perälle. Jos olet kiinnostunut jostakin niistä niin kertonet. Voin yrittää laittaa ko. lehdet syrjään kunhan tulevat esille. Isommissa erissä vain nouto Espoon Tapiolasta. t. Pekka Harkkomaa, pekka.harkkom...@luukku.com Nuo olisi hyvä saattaa pdf muotoon ja vaikkapa laittaa jakoon tilaajien saataville. KTU___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan
At 19:31 30.9.2013, you wrote: Nuo olisi hyvä saattaa pdf muotoon ja vaikkapa laittaa jakoon tilaajien saataville. KTU Jaajuu siis tarkennus: tarkoitin nimenomaan originaalien printtiversioiden säilömistä. Jälkeenpäin digitoidut versiot eivät sisällä keräilyarvoa, eivät juurikaan kulttuurihistoriallistakaan arvoa. 73, IS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Museovehkeillä reaaliajassa. Ei laiskaa persepuuhaamista. ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan / digitointi
Tervehdys, Kyllä vaan, SDXL:n jäsenlehtien (1958-) digitointihanke on meneillään. Valmisteluja on tehty pienellä porukalla nyt aluksi, että saadaan hiottua perusprosessit kuntoon. Ensiksi on tarkoitus tuottaa pelkät näköis-PDF:t ja toisessa vaiheessa - jos intoa ja innokkaita riittää - tekstintunnistusohjelmalla (OCR) ajetut sanahakukelpoiset PDF:t. Lisäarvo tästä jälkimmäisestä olisi melkoinen, mutta äärimmäisen työläs, sillä tunnistustarkkuus ei aina ole 100%, vaan tekstit vaativat manuaalista tarkistusta ja korjausta. Jos siihen vaiheeseen päästään, kaikki apu on tervetullutta. Selailtuani muutaman mapillisen 90-luvun enimmillään 60-sivuisia lehtiä, tulin vahvasti siihen tulokseen, että jotain radikaalia helpotusta tarvitaan skannausvaiheeseen. Tasoskanneri tuottaa laadukkaita kuvia, mutta käyttö on hidasta ja puuha tarkkaa. Näinpä päädyin sellaiseen ratkaisuun, että hankin omiin nimiini tämän alan harrastajien kehitystyön tuloksena syntyneen härvelin eurooppalaisen version rakennussarjan: http://www.diybookscanner.org/forum/viewtopic.php?f=14t=1192. Sen toiminta perustuu V-muotoisessa telineessä olevan avoimen lehtiaukeaman molemmista sivuista yhtä aikaa otettaviin valokuviin 16 megapikselin kameralla, valon tullessa ylhäältä. Käsikäyttöisen nostomekanismin avulla lähes heijastamattomat lasitasot painavat kuvattavat sivut suoriksi ja USB-pedaalin painalluksella laukaistaan kamerat (kuvissa vanha mekaaninen käsilaukaisuviritys). Mekanismin yläasentoon palautuksen ja sivunkäännön jälkeen voi ottaa kuvat seuraavasta aukeamasta. Tällä olen ajatellut kuvata nyt itselläni olevat osin Ähtärin arkistosta noudetut vuosikerrat 1967-2010 (uudemmat jo PDF:inä). Mekaniikka on ollut kuukauden verran koossa ja nyt yritän saada Canonin CHDK-skripteillä ja Ubuntulla ohjatut kamerat sekä valaistuksen vireeseen. Windows-taustaisena siinäkin on hieman haastetta. Lisäksi tulee vielä JPG-kuvien jälkikäsittely (esim. GIMP -Scan Tailor - Acrobat), mutta sitäkin ketjua on mahdollista automatisoida. Vanhimpia 50-60 -lukujen taitteen monistelehtiä on PS:llä jo valmiinakin, mutta vielä odottelemme saittipalvelujemme tarjoajalta RKO:lta vahvistusta levytilan riittävyydestä, indeksoitujen hakujen mahdollisuudesta ym. käytännön asioista. Kaikki 1958-2013 lehdet lienevät (kertaalleen) digitoituja ja luettavissa ensi vuoden kesäkokoukseen mennessä - hieman riippuu miten palaset loksahtavat kohdilleen. Koska usein kuultu kommentti on ollut, että jäsenmaksulle pitäisi saada enemmän vastinetta - eikä valtionavun pienennys tässä suhteessa asiaa ainakaan helpota - on lähtökohtana ollut, että DXClusiven tapaan lehtien lukeminen olisi webmasterin antaman tunnuksen ja salasanan takana. Kyseessä kun ovat kuitenkin nimenomaan jäsenlehdet. Mutta tästä saa olla eri mieltäkin. Apropos, tuo Ähtärin arkisto on toiminnassa (ks. RM 10/2008) ja sinne voi toimittaa fyysisiä DX-kokoelmiaan harkinnan mukaan. Mutta ensin kannattaa lukea tuo juttu ja ainakin olla SIH:iin yhteydessä. t. PRI Date: Mon, 30 Sep 2013 19:57:34 +0300 From: ilkka suni ... To: Suomalaisten DX-lista dx@hard-core-dx.com Subject: Re: [DX] DX-lehtiä annataan At 19:31 30.9.2013, you wrote: Nuo olisi hyvä saattaa pdf muotoon ja vaikkapa laittaa jakoon tilaajien saataville. KTU Minulla on se käsitys, että Liiton takavuosien julkaisujen digitointi koordinoidusti on jo hyvässä vauhdissa. Asiasta oli postituslistalla puhetta viimeksi... olikohan toukokuussa. Taitaa Pasi eli PRI koordinoida hommaa, hän tiennee kertoa. 73, IS ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html
Re: [DX] DX-lehtiä annataan / digitointi
Hienoa, Pasi, että päivitit tilannetta. Mutta. Eihän prosessi todellisuudessa voi olla noin työläs ja vaikea, eihän? 73, IS _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ Museovehkeillä reaaliajassa. Ei laiskaa persepuuhaamista. ___ DX mailing list DX@hard-core-dx.com http://montreal.kotalampi.com/mailman/listinfo/dx ___ THE INFORMATION IN THIS ARTICLE IS FREE. It may be copied, distributed and/or modified under the conditions set down in the Design Science License published by Michael Stutz at http://www.gnu.org/licenses/dsl.html