Tema: Re: Html failo parsinimas
Autorius: Rimantas Liubertas
Data: 2010-06-21 13:21:28
> Na gerai, koduotės šiaip yra vienodos - windows-1257, bet kažkodėl jei
> spausdinu iš DOM reikšmę, man rodo su hieroglifais. Tą ir noriu
> išsiaiškinti. Kodėl Spausdinant parsiųstą failą ir to failo reikšmę per
> DOM skiriasi koduotės?
Nes tas DOM yra kreivas ir duotam tekste neradęs <meta…> su nurodyta
koduote, galvoja, kad ten latin-1.
Gali pamėginti vietoj
$dom->loadHTML($html_data);
panaudoti
$dom->loadHTML('<meta http-equiv="Content-Type" content="text/html;
charset=Windows-1257">' . $html_data);
Negražu, bet turi suveikti.
Taip pat reikia nepamiršti, kad tai ką tu gauni IŠ DOM (su nodeValue)
jau bus UTF-8 koduotėj. Jei reikia iš DOM gautą tekstą pateikti kitokia
koduote — teks konvertuoti.
ic
--
http://rimantas.com/