Sælt veri fólkið.
Ég er að gera aðra tilraun með orðalistakerfi. Einhverjir muna kanski að ég
var kláraði næstum því svona kerfi sem keyrði á gagnagrunni og java. Það
notaði það varla nokkur maður, svo ég gafst upp á því. Nú er ég að gera aðra
tilraun sem byggist á XML, CVS og XLS. Mig grunar að þetta verði miklu
meðfærilegra en gamla kerfið og það sé líklegra að það komist einhver skikkur
á þessi orðalistamál. Sérstaklega ef einhver nennir að setja þýðingalistana
saman :^)
Hugmyndin er að skilgreina DTD fyrir XML form fyrir orðalista. Það væri ekki
bara einn risastór orðalisti, heldur margir litlir listar, hver um ákveðið
eftni. Einn fyrir skráarkerfisorðaforða, einn fyrir netsaskipti, einn fyrir
forritunarmál o.s.fr. Hver þessara lista væri geymdur í XML skrá á þessu
ákveðna formi.
XML skrárnar væru geymdar á CVS þjóni. Þannig er hægt ða gefa hverjum sem er
aðgang til að breyta orðalistunum og það er kerfi til að samræma breytingar
sem menn gera hver í sínu horni og til að fylgjast með hvaða breytingar eru
gerðar og e.t.v. að bakka með þær. XML skrár eru textaskrár og henta mjög vel
til geymslu í CVS.
Með þessu skeyti fylgja fyrsta uppkast að DTD fyrir orðalista, sýnidæmi um
svona XML kóða ásamt skjámynd af því hvernig þessi sýnikóði lítur út í einum
XML ritli sem ég valdi af handahófi. Þessi ritill er reyndar ekki alveg eftir
mínu höfði því hann er of grafískur og of músarfatlaður, en það er víst til
fólk sem vill þannig forrit. Ég lýsi hérmeð eftir linux (eða java) ritli sem
kann XML og DTD og gefur manni einhverskonar vísbendingar um hvaða kóða er
löglegt að setja inn á ákveðinn stað í skrána.
Næsta þrep er að nota XLS til að breyta þessum XML skrám í HTML til birtingar
á vefnum. Mér sýnist cocoon frá Apache hópnum einmitt vera græjan til þess og
ef ég sef mjög lítið í nótt verður það komið upp einhverstaðar (líklega á
ferðavélinni minni) fyrir morgun.
Svo má með tímanum búa til almennilegt leitarkerfi sem leitar í öllum þessum
XML skrám í einu og birtir á HTML formi of fleira í þeim dúr, en það er
seinni tíma vandamál.
PS ekki vera hrædd við UTF-8 kóðunina á skjalinu. Allir xml ritlar kunna á
þetta og einkstaka venjulegur ritill líka.
--
Logi Ragnarsson - [EMAIL PROTECTED]
Some day we all shall be out of scope
<!ELEMENT glossary (linked*, translation*) >
<!ATTLIST glossary title CDATA #REQUIRED>
<!ATTLIST glossary from CDATA #REQUIRED>
<!ATTLIST glossary to CDATA #REQUIRED>
<!ELEMENT linked (#PCDATA) >
<!ELEMENT translation (original*, meaning*) >
<!ELEMENT original (word, usage?, notes?) >
<!ELEMENT meaning (word, usage?, notes?) >
<!ELEMENT word (#PCDATA) >
<!ELEMENT usage (#PCDATA) >
<!ELEMENT notes (#PCDATA) >
<?xml version="1.0"?>
<!DOCTYPE glossary SYSTEM "glossary.dtd">
<glossary title="Example Glossary" from="en" to="is">
<linked>typical.xml</linked>
<linked>standard.xml</linked>
<translation>
<original>
<word>Folder</word>
<usage>A folder containing many files and sub-folders.</usage>
<notes>Mostly used for graphically represented folders.</notes>
</original>
<original>
<word>Directory</word>
<usage>A directory containing many files and sub-directories.</usage>
<notes>Mostly used for textual directories.</notes>
</original>
<meaning>
<word>Mappa</word>
<usage>Mappa með mörgum skram og undirmöppum.</usage>
</meaning>
</translation>
<translation>
<original>
<word>File</word>
<usage>This file holds a list of phone numbers.</usage>
</original>
<meaning>
<word>Skra</word>
<usage>I þessari skra er listi af simanumerum</usage>
</meaning>
</translation>
</glossary>
PNG image