Tema: Lietuviškas automatinio taisymo žodynas
Autorius: Rimas Kudelis
Data: 2009-12-15 00:34:34
Sveiki,

pasirodo, iki šiol nėra jokio laisvo lietuviško „Autocorrect“ (t.y.,
dažniausių elementarių klaidų) žodyno. Galbūt atsirastų norinčių
prisidėti prie tokio daikto sudarymo?

Procesas, manau, būtų gan paprastas: tereikėtų žodžių poras (klaida,
teisingas žodis) surinkti į vieną vietą patogiu formatu (pvz., į grynojo
teksto failą ar į kokį tinklalapį ar vikį ar pan.).  Realiai, čia
prisidėti galėtų bet kas ir bet kokiu žodžių kiekiu.

Tokių porų pavyzdžiai:
akd -> kad
agl -> gal
apei -> apie

ir pan.

Gan konkretus šio darbo pritaikymas būtų jo įtraukimas į OpenOffice.org
raštinės programų paketą. Palyginimui, angliškame OOo šių porų faile jų
yra virš 800.

Beje, kalbant apie OpenOffice.org, yra ir dar pora smulkesnių darbelių,
kuriuos per šį vakarą praktiškai padariau – tai surinkti įprastas 
santrumpas, kurios nelaikomos sakinio pabaiga (tokias kaip „p.“, „pan.“ 
ir „t. y.“) bei tokias, kurių pradžioje yra po kelias didžiąsias raides, 
tačiau yra ir mažųjų (pvz., „MHz“). Tokių santrumpų angliškuose failuose 
šiuo metu yra atitinkamai 125 ir 10, o mano sukompiliuotuose 
lietuviškuose – 187 ir 4.

Rimas