Az XML formázási szabályai
2004-04-17T18:54:44+02:00
2004-04-19T19:25:59+02:00
2022-07-27T12:52:37+02:00
  • A cikkben hamarosan javitasra kerul ezen hiba, addig becopyznam ide simi.2 beleegyezesevel a nekem priviben irt magyarazatat:


    A kódolások arról szólnak, hogy a karaktereket milyen byte-sorozattal reprezentáljuk. Az internacionális (pl. ISO-8859-2) kódkészletek egy bájton ábrázolnak karaktereket, és a felső 128 értéken reprezentálnak spéci karaktereket. Pl. a fenti példa a közép-európában használt ékezeteket.

    Mivel ezek egy bájton ábrázolnak, ezért nem fér beléjük az összes idegen karakter, meg van határozva, hogy melyik melyik karaktereket "ismeri". Ennek kiküszöbölésére született meg az Unicode (UTF-16), ami két bájton ábrázolja az összes létező karaktert. Mivel a két bájtos ábrázolás nagyon pazarló tud lenni a hagyományos szövegek leírásakor, ezért azt prefixmentesen, nem fix hosszon kódolták úgy, hogy a leggyakrabb angol karakterek kódja egy byte-on elférjen. Ez az UTF-8, ami tehát valódi Unicode, minden karaktert ismer, csak egyes karaktereket rövidebben tárol.

    Mutasd a teljes hozzászólást!
  • A hibaval kapcsolatban teljesen igazad van, mar tobben eszrevettek. Sajna atsiklottam felette, es enis csak utolag vettem eszre.
    Kulon koszonet az eszrevetelert az olvasoknak!
    Mutasd a teljes hozzászólást!
  • Még nem olvastam végig, de egy apró figyelmetlenséget találtam a cikkben:

    XML feldolgozó alapállapotban feltételezi, hogy UTF-8-as kódolást használunk, amely a standard angol billentyűzeten megtalálható karaktereket ismeri. Viszont, ha mi magyar ékezetes karaktereket szeretnénk használni, ez a kódolás nem megfelelő, ezért egy másikat kell választanunk


    Ez azért szerencsére nem igaz. Az UTF-8 szintén a Unicode egyik fajta kódolása, így bármilyen Unicode karaktert (tehát magyar ékezetet is) tartalmazhat.
    Mutasd a teljes hozzászólást!
abcd