Tema: Kaip nusiskaityti zymeta XML?
Autorius: mrlz777
Data: 2011-04-01 14:07:24
Sveiki,

noreciau nuskaityti XML faila (tei p5 formatu) ir susidet ji i db.
Esme, kad ten yra rislus tekstas, bet kiekvienas zodis morfologiskai 
suzymetas, skyrybos zenklai ir tarpai tarp <pc></pc> tagu.

Reiktu:
1. Atskirai i lenteles susideti atributu "lemma", "ana" reiksmes, ir pati 
zodi.
2. I lentele issisaugoti ir visa sakini.

Kaip pasiulytumet toki varianta realizuot? :)

Siaip radau, kad su $xml = simplexml_load_file("test.xml"); gali pasidaryti 
objekta, ir tada gali gauti atributu reiksmes, zodi ir pan. Pvz. su print 
$xml->text->body->p->w[1]['lemma']; gautume lemma reiksme "vadovas" ir t.t.

Bet nelabai sugalvoju kaip nusiskaityti sakinius su visais tarpais tarp 
zodziu, skyrybos zenklais... Nes sakiniuose <pc></pc> tagu gali but daugiau 
nei zodziu, tai nelabai iseina su vienu for ciklu prasisukt:)


Istrauka is XML failo:
....
<text>
<body>
<p>

<w lemma="Kautros" ana="#n">Kautros</w>
<pc> </pc>
<w lemma="vadovas" ana="#dbvdv">vadovai</w>
<pc> </pc>
<w lemma="prisipžinti" ana="#vatsted3">prisipažįsta</w>
<pc>.</pc>

</p>
</body>
</text>
....
Zinoma sakinys gali baigtis ir daugtaskiu, klaustuku, sauktuku..



Dekui.

www.boulingas.net - Boulingo diskusijos.