Solution de l'exercice 3

Voici les classes utiles.

La pyramide sera représentée par un tableau des lignes de décorations, une ligne sera un tableau de décoration de la longueur appropriée, les décorations seront des ensembles de symboles (classe SymbolSet, les symboles sont des caractères). La déclaration de la pyramide sera donc

SymbolSet [] [] m ; // Tableau de tableaux d'ensembles de symboles

Pour éviter de nous fatiguer trop, définissons la classe SymbolSet comme des listes de caractères sans répétitions, l'ensemble vide étant représenté par null.

class SymbolSet{char val ; SymbolSetnext ;// test d'appartenancestatic boolean mem(char c, SymbolSete)// ajouter un élémentstatic SymbolSet add(char c, SymbolSete)// union des ensemblesstatic SymbolSet union(SymbolSet e1, SymbolSete2) }

Les champs val et next sont exposés pour nous permettre d'itérer facilement sur les ensembles.

Lors de la construction de la pyramide, nous avons en fait besoin de retrouver les ensembles de non-terminaux correspondant à un membre droit donné, ces membres droits sont de deux sortes possibles : un simple symbole (qui est toujours terminal) ou une paire de symboles (qui sont toujours non-terminaux). En faisant fi de la distinction entre terminaux et non-terminaux, nous avons donc besoin d'une classe Pair des paires de symboles.

class Pair{charfst, snd ;Pair (char c1, charc2) { fst = c1 ; snd = c2 ; } }
La classe Chomsky proposera trois méthodes, deux méthodes pour retrouver tous les non-terminaux définis par un membre droit donné, et une méthode qui donne le symbole de départ.

class Chomsky{SymbolSet getLhs(chart)SymbolSet getLhs(Pairp)chargetStartSymbol() ; }

Bon nous voilà prêts. Commençons par traiter le cas de l'entrée vide et par déclarer notre pyramide.

static boolean parse(Chomsky g, Stringalpha) {intlen = s.length() ;if (len == 0) return false;SymbolSet [] [] m = new SymbolSet [len+1] [];

L'initialisation de m est une initialisation de tableau, dont les éléments sont des tableaux (valant ici initialement null). On notera que le tableau m comprend ℓ+1 éléments, ainsi m[j][i] sera m_j,i. La ligne d'indice zéro ne sera pas employée.

Remplissons la base, qui est la ligne d'indice 1.

SymbolSet [] m1 = new SymbolSet[len] ;for (inti = 0 ; i < len ; i++) { m0[i] = g.getLhs(alpha.charAt(i)) ; } m[1] = m1 ;

C'est tout à fait facile, puisque la majeure partie du travail (regrouper les productions de membre droit identique) est faite par la méthode getLhs de la classe Chomsky.

Enfin construisons les lignes de la base vers de sommet.

for (int j = 2 ; j <= len ; j++) { // Pour toutes les longueurs jSymbolSet [] row = new SymbolSet[len-j+1] ;for (inti = 0 ; i <= len-j ; i++) {// Pour tous les indices i de sous-chaînes de longueur jSymbolSet set = null;for (intk = 1 ; k < j ; k++) {// Pour tous les découpages de [i..i+j[ en [i..i+k[ et ...for (SymbolSet p = m[k][i] ; // [i..i+k[p !=null; p = p.next) {for(SymbolSet q = m[j-k][i+k] ; //[i+k..i+k+k'[, k+k' = jq !=null; q = q.next) { set =SymbolSet.union(g.getLhs(new Pair(p.val, q.val)), set) ; } } } row[i] = set ; } m[j] = row ; }

Ce n'est pas si difficile que ça en a l'air. Une fois fixée une décomposition en deux de la sous-chaîne α[i…i+j[ dont la première composante est de longueur k (avec 1 ≤ k ≤ j−1) on obtient les deux ensembles E = m_k,i et E' = m_{k', i+k} (avec k+k' = j). Il faut ensuite considérer toutes les paires (A,A') (avec A ∈ E et A' ∈ E') et accumuler les membres droits des productions de la forme B → A A'. D'où les cinq boucles imbriquées...

Et on peut enfin savoir si α dérive du symbole de départ de g.

return SymbolSet.mem(g.getStartSymbol(),m[len][0]) ; }

Les clefs des tables de hachage seront donc des charactères (classe Character) et nos paires (classe Pair).

class Pair{charfst, snd ;Pair (char c1, charc2) { fst = c1 ; snd = c2 ; }public booleanequals(Object o) {if (o == null) return false;try{Pair p = (Pair)o ;returnfst == p.fst && snd == p.snd ; }catch(ClassCastException e) {return false; } }public inthashCode() {intf = fst ;ints = snd ;inth = (f << 16) | s ;returnh ; }public StringtoString() {return"(" + fst + "," + snd + ")" ; } }

On remarque que equals doit traiter le cas où l'objet o n'est pas une paire, car nous avons deux classes de clefs différentes pour une même table. La méthode hashCode est naïve et exploite que les caractères sont des entiers sur 16 bits (tandis que les int sont sur 32 bits).

Et voici la classe Chomsky.

importjava.util.* ;class Chomsky{private charstart ;private Hashtablet_lhs ;char getStartSymbol() { returnstart ; }static private void error(Stringmsg) {System.err.println("Chomsky: " + msg) ;System.exit(2) ; }private void add(Object key, charc) {SymbolSet p = (SymbolSet)(t_lhs.get(key)) ; t_lhs.put(key,SymbolSet.add (c, p)) ; }Chomsky(char c, Rulesrs) { start = c ; t_lhs =new Hashtable() ;for (Rules p = rs ; p != null; p = p.next) {charlhs = p.lhs ;Listrhs = p.rhs ;if (rhs == null) error("règle vide") ;if (rhs.next == null) { add(new Character(rhs.val), lhs) ; }else if (rhs.next.next == null) { add(new Pair(rhs.val, rhs.next.val), lhs) ; }elseerror("règle trop longue") ; } }SymbolSet getLhs(Pairp) {return (SymbolSet)t_lhs.get(p) ; }SymbolSet getLhs(chart) {return (SymbolSet)t_lhs.get(new Character(t)) ; } }