Il existe des initiations à HTML sur le web, autant regarder
directement celle du W3C (l'instance de normalisation du HTML)
http://www.w3.org/MarkUp/Guide/.
Une autre initiation qui évite de se restreindre à la toute dernière
spécification de HTML est en
http://werbach.com/barebones/barebones.html.
Pour l'extension de traduction vers un HTML plus moderne avec feuilles
de style, voici la référence
du langage “Cascading Style Sheets 2”.
Sur les analyses lexicales et syntaxiques
C'est traité
ici
et
là.
Notez bien qu'il n'est pas question d'analyser une page HTML
complète. Il suffit de mettre les éléments de niveau texte sous forme
de structure arborescente.