Caratteri impostati in HTML

Caratteri impostati in HTML
Ogni volta che un utente del computer colpisce una chiave sulla tastiera, viene generato un codice di carattere pertinente per rappresentare quella sequenza. Questi codici dei caratteri formano un set di caratteri che deve essere in grado di comunicare con il computer. Il set di caratteri HTML consente di caricare correttamente le pagine utilizzando i codici dei caratteri di simboli/caratteri. In questo post, otterresti i vari set di caratteri utilizzati in HTML.

Caratteri impostati in HTML

Esistono numerosi set di caratteri utilizzati nelle versioni precedenti di HTML. Qui discuteremo tutto il set di personaggi precedentemente e attualmente supportato.

Set di caratteri ASCII

L'ASCII è un set di caratteri a 7 bit che consente a 128 caratteri di rappresentare i termini della lingua inglese in formato comprensibile del computer. Alcune caratteristiche di ASCII sono descritte di seguito:

- Le cifre (0-9) e tutte le 26 lettere alfabetiche possono essere rappresentate usando ASCII

- Tutti i set di caratteri utilizzati in HTML sono basati su ASCII

La limitazione principale del set di caratteri ASCII è che supportava solo 128 caratteri che potevano supportare solo termini di lingua inglese (alfabeti), cifre (0-9) e segni di punteggiatura. dipendente dal linguaggio e limitato.

Set di caratteri ISO 8859-1

Dalle versioni recenti, HTML 4.0 ha inventato l'ISO-8859-1 come set di caratteri predefiniti. L'ISO 8859-1 è un'estensione del set di caratteri ASCII e rappresenta i caratteri in codice a 8 bit. Può rappresentare 256 caratteri che lo rendono anche uno schema di codifica dipendente dal linguaggio. Un set di caratteri è definito nel meta tag del documento HTML e il seguente codice aiuterà a utilizzare ISO 8859-1 nel documento HTML:

Nota: Sebbene HTML5 contenga un set di caratteri UTF-8, può anche essere utilizzato con ISO-8859-1 utilizzando la seguente riga nel tag.

Set di caratteri UTF-8

Il set di caratteri Unicode comprende i valori decimali che rappresentano i caratteri, i simboli e i segni di punteggiatura. Questi valori decimali basati su Unicode vengono quindi convertiti in formato comprensibile al computer usando UTF-8, UTF-16 o UTF-32. Tuttavia, l'UTF-8 è consigliato per le pagine Web in quanto copre tutti i caratteri/simboli/segni di punteggiatura che possono essere utilizzati in un documento HTML.

Di seguito sono riportate le caratteristiche salienti di UTF-8

- L'ultimo set di caratteri è stato predefinito per HTML5.

- Può essere aggiunto anche alla versione HTML4.

- L'UTF-8 funziona sulla base di ASCII e i primi 128 caratteri in UTF-8 sono gli stessi di ASCII.

- Supporta tutti i simboli, i caratteri e i segni di punteggiatura utilizzati in tutto il mondo

- Converte i numeri/caratteri/simboli/marchi di punteggiatura in uno o quattro byte

Dalla discussione di cui sopra, l'importanza di UTF-8 ha fatto un terreno solido per l'obsolezione di set ASCII e ISO-8859-1-Character.

Nota: L'Unicode.Org fornisce tutti gli unicodi dei personaggi, simboli, emoji, segni di punteggiatura.

Come utilizzare UTF-8 in HTML4

L'HTML4 è arrivato con ISO-889-1 come set di caratteri predefiniti. Tuttavia, è possibile aggiungere il set di character UTF-8 in HTML4 utilizzando il seguente meta tag.

Come usare ISO-8859-1 in HTML5

Poiché il set di caratteri predefinito di HTML5 è UTF-8 che supera i set di caratteri più vecchi. Tuttavia, è possibile aggiungere il set di caratteri ISO-8859-1 nel tuo documento HTML utilizzando la seguente riga nel nostro tag Head.

Conclusione

Il set di caratteri converte i simboli, i caratteri o qualsiasi tastiera a un formato leggibile da computer. Questo articolo fornisce una panoramica dei set di caratteri utilizzati in HTML a partire dalle versioni precedenti all'ultimo HTML5. L'ASCII è il set di personaggi più antichi con supporto limitato per personaggi e lingua (solo lingua inglese). Più tardi, ASCII è stato esteso a 256 caratteri con supporto a 8 bit per costruire un nuovo set di personaggi chiamato ISO-8859-1. ISO-8859-1 è il set di caratteri predefiniti per HTML4 ma offre un supporto limitato ai caratteri (256). L'UTF-8 copre tutte le carenze dell'ISO-8859-1 e quindi UTF-8 è arrivato come un carattere predefinito impostato in HTML5.