Tema: Re: Html failo parsinimas
Autorius: bertas
Data: 2010-06-21 15:18:59
Labai didelis ačiū - dabar gerai, tikriau gaunu tai ko reikia, nes man 
ir reikalinga utf-8.
2010.06.21 13:21, Rimantas Liubertas rašė:
>> Na gerai, koduotės šiaip yra vienodos - windows-1257, bet kažkodėl jei
>> spausdinu iš DOM reikšmę, man rodo su hieroglifais. Tą ir noriu
>> išsiaiškinti. Kodėl Spausdinant parsiųstą failą ir to failo reikšmę per
>> DOM skiriasi koduotės?
>
> Nes tas DOM yra kreivas ir duotam tekste neradęs <meta…> su nurodyta
> koduote, galvoja, kad ten latin-1.
>
> Gali pamėginti vietoj
>
> $dom->loadHTML($html_data);
>
> panaudoti
>
> $dom->loadHTML('<meta http-equiv="Content-Type" content="text/html;
> charset=Windows-1257">' . $html_data);
>
> Negražu, bet turi suveikti.
>
> Taip pat reikia nepamiršti, kad tai ką tu gauni IŠ DOM (su nodeValue)
> jau bus UTF-8 koduotėj. Jei reikia iš DOM gautą tekstą pateikti kitokia
> koduote — teks konvertuoti.
>
>
> ic
> --
> http://rimantas.com/
>
>