Tag Meta Charset ing HTML5

Ngatur Karakter Encoding ing HTML5

Sadurungé introduksi HTML5, setting encoding karakter ing sawijining dokumen kanthi subyek kanggo nulis baris sing rada jelas ing ngisor iki. Iki minangka elemen Meta Charset yen sampeyan nggunakake HTML4 ing kaca web sampeyan:

Apa sing penting kanggo sok dong mirsani ing codeare iki tandha kutip sing ndeleng watara atribut isi : content = " text / html; charset = iso-8859-1 " . Kaya kabeh atribut HTML, tandha kutip iki nemtokake nilai atribut, nuduhake yen kabeh teks / html senar ; charset = iso-8959-1 isi isi. Iki HTML sing bener lan carane iki sengaja ditulis. Sampeyan uga ora sabar lan ala! Iku uga ora soko sampeyan bakal kamungkinan eling saka ndhuwur sirah! Ing kasus-kasus sing paling umum, pangembang web kudu nyalin lan nempel kode iki saka siji situs menyang apa wae sing anyar sing dikembangake amarga nulis iki saka scratch akeh.

HTML5 Ngeculake Ekstra & # 34; Barang & # 34;

HTML5 ora mung nambah sawetara unsur anyar menyang basa, nanging uga nyederhanakake sintaks HTML, kalebu unsur Meta Charset. Kanthi HTML5, sampeyan bisa nambah panyandian karakter kanthi luwih gampang ngelingi sintaks kanggo unsur META sing sampeyan ndeleng ngisor:

Bandingake sintaks sing disederhanakake kanggo apa sing kita tulis ing wiwitan artikel iki, sintaks lawas sing digunakake kanggo HTML4, lan sampeyan bakal bisa ndeleng manawa luwih gampang kanggo nulis lan ngelingi versi HTML5 sing bener. Tinimbang kudu nyalin lan nempelake iki saka situs sing wis ana menyang sembarang anyar sing digunakake, iki pancen soko sing, minangka pangembang web ngarep, sampeyan bisa ngelingi. Iki tabungan wektu akeh ora akeh, nanging nalika sampeyan nimbang wilayah sintaks liyane sing HTML5 sing disederhanakake, tabungan nambah nambah!

Tansah Kalebu Pengodean Karakter

Sampeyan kudu tansah nyakup encoding karakter kanggo kaca web, sanajan sampeyan ora tau dimaksudaké kanggo nggunakake sembarang karakter khusus . Yen sampeyan ora nglebokaké encoding karakter, situs sampeyan dadi rentan kanggo serangan skrip situs salib nggunakake UTF-7.

Ing skenario iki, anattacker weruh yen situs sampeyan ora ana encoding karakter sing ditemtokake, mula trik browser kasebut mikir yèn encoding karakter kasebut bener-bener UTF-7. Sabanjure, panyerang injects skrip enkod UTF-7 menyang kaca web lan situs sampeyan disusupi. Iki temenan masalah kanggo everyone melu, saka perusahaan menyang pengunjung. Kabar apik iku masalah prasaja kanggo ngalangi - mung manawa kanggo nambah enkoding karakter menyang kabeh kaca web sampeyan.

Endi Tambah Character Encoding

Enkoding karakter kanggo kaca web kudu baris pisanan elemen HTML. Iki mesthine yen browser mangerteni apa enkoding karakter sadurunge nggawe apa-apa liya ing kaca liyane tinimbang kanggo nemtokake doctype lan ngenali Kaca HTML. HTML Sampeyan kudu maca:

...

Nggunakake HTTP Headers kanggo Keamanan Ekstra

Sampeyan uga bisa nemtokake encoding karakter ing header HTTP. Iki malah luwih aman tinimbang nambahake menyang kaca HTML, nanging sampeyan ora bakal nduweni akses menyang konfigurasi server utawa .htaccess file, sing artine sampeyan perlu nggarap panyedhiya hosting situs web sampeyan kanggo ngakses akses jinis kasebut utawa nggawe owahan kanggo sampeyan. Akses punika saestu tantangan ing mriki. Owah-owahan kasebut prasaja, supaya panyedhiya hosting kudu bisa nggawe owah-owahan kasebut kanthi gampang.

Yen sampeyan nggunakakeApache, sampeyan bisa nyetel setel standar kanggo kabeh situs kanthi nambahake: AddDefaultCharset UTF-8 menyang file .htaccess root. Setel karakter standar Apache yaiku ISO-8859-1 .