Caratteri impostati in HTML
Esistono numerosi set di caratteri utilizzati nelle versioni precedenti di HTML. Qui discuteremo tutto il set di personaggi precedentemente e attualmente supportato.
Set di caratteri ASCII
L'ASCII è un set di caratteri a 7 bit che consente a 128 caratteri di rappresentare i termini della lingua inglese in formato comprensibile del computer. Alcune caratteristiche di ASCII sono descritte di seguito:
- Le cifre (0-9) e tutte le 26 lettere alfabetiche possono essere rappresentate usando ASCII
- Tutti i set di caratteri utilizzati in HTML sono basati su ASCII
La limitazione principale del set di caratteri ASCII è che supportava solo 128 caratteri che potevano supportare solo termini di lingua inglese (alfabeti), cifre (0-9) e segni di punteggiatura. dipendente dal linguaggio e limitato.
Set di caratteri ISO 8859-1
Dalle versioni recenti, HTML 4.0 ha inventato l'ISO-8859-1 come set di caratteri predefiniti. L'ISO 8859-1 è un'estensione del set di caratteri ASCII e rappresenta i caratteri in codice a 8 bit. Può rappresentare 256 caratteri che lo rendono anche uno schema di codifica dipendente dal linguaggio. Un set di caratteri è definito nel meta tag del documento HTML e il seguente codice aiuterà a utilizzare ISO 8859-1 nel documento HTML:
Nota: Sebbene HTML5 contenga un set di caratteri UTF-8, può anche essere utilizzato con ISO-8859-1 utilizzando la seguente riga nel tag.
Set di caratteri UTF-8
Il set di caratteri Unicode comprende i valori decimali che rappresentano i caratteri, i simboli e i segni di punteggiatura. Questi valori decimali basati su Unicode vengono quindi convertiti in formato comprensibile al computer usando UTF-8, UTF-16 o UTF-32. Tuttavia, l'UTF-8 è consigliato per le pagine Web in quanto copre tutti i caratteri/simboli/segni di punteggiatura che possono essere utilizzati in un documento HTML.
Di seguito sono riportate le caratteristiche salienti di UTF-8
- L'ultimo set di caratteri è stato predefinito per HTML5.
- Può essere aggiunto anche alla versione HTML4.
- L'UTF-8 funziona sulla base di ASCII e i primi 128 caratteri in UTF-8 sono gli stessi di ASCII.
- Supporta tutti i simboli, i caratteri e i segni di punteggiatura utilizzati in tutto il mondo
- Converte i numeri/caratteri/simboli/marchi di punteggiatura in uno o quattro byte
Dalla discussione di cui sopra, l'importanza di UTF-8 ha fatto un terreno solido per l'obsolezione di set ASCII e ISO-8859-1-Character.
Nota: L'Unicode.Org fornisce tutti gli unicodi dei personaggi, simboli, emoji, segni di punteggiatura.
Come utilizzare UTF-8 in HTML4
L'HTML4 è arrivato con ISO-889-1 come set di caratteri predefiniti. Tuttavia, è possibile aggiungere il set di character UTF-8 in HTML4 utilizzando il seguente meta tag.
Come usare ISO-8859-1 in HTML5
Poiché il set di caratteri predefinito di HTML5 è UTF-8 che supera i set di caratteri più vecchi. Tuttavia, è possibile aggiungere il set di caratteri ISO-8859-1 nel tuo documento HTML utilizzando la seguente riga nel nostro tag Head.
Conclusione
Il set di caratteri converte i simboli, i caratteri o qualsiasi tastiera a un formato leggibile da computer. Questo articolo fornisce una panoramica dei set di caratteri utilizzati in HTML a partire dalle versioni precedenti all'ultimo HTML5. L'ASCII è il set di personaggi più antichi con supporto limitato per personaggi e lingua (solo lingua inglese). Più tardi, ASCII è stato esteso a 256 caratteri con supporto a 8 bit per costruire un nuovo set di personaggi chiamato ISO-8859-1. ISO-8859-1 è il set di caratteri predefiniti per HTML4 ma offre un supporto limitato ai caratteri (256). L'UTF-8 copre tutte le carenze dell'ISO-8859-1 e quindi UTF-8 è arrivato come un carattere predefinito impostato in HTML5.