fix html escape
[c-standard] / ann2html.sh
index 6b27ecd..9acba62 100755 (executable)
@@ -8,12 +8,22 @@ BEGIN {
        ss[sid] = "<pre>"
 }
 
-{
+function esc() {
        gsub(/\&/, "\\&amp;")
        gsub(/</, "\\&lt;")
        gsub(/>/, "\\&gt;")
 }
 
+{
+       esc()
+}
+
+!title && /^[^@]/ {
+       title = $0
+       gsub(/  +/, "  ", title)
+       gsub(/Committee Draft --/, "", title)
+}
+
 /^@sect Contents/ {
        ss[sid] = ss[sid] "</pre>\n"
        seencontents = 1
@@ -29,6 +39,7 @@ seencontents && !seenfore && /^[^@]/ {
        s = $0
        if (!sub(/ +\. .*/, "", s)) {
                getline
+               esc()
                sub(/^ */, " ")
                s = s $0
                sub(/ +\. .*/, "", s)
@@ -72,14 +83,18 @@ seencontents && !seenfore && /^[^@]/ {
        }
        sid++
        getline
+       esc()
        ss[sid] = ss[sid] "<h1>" $0 "</h1>\n"
-       title = $0
        if (!seencontents) {
                ss[sid] = ss[sid] "<pre>\n"
        }
        next
 }
 
+/^@sect 3\./ {
+       markdef = 1
+}
+
 /^@sect/ {
        sid++
        slevel = split($2,a,/\./)+1
@@ -87,8 +102,9 @@ seencontents && !seenfore && /^[^@]/ {
                slevel = 5
        sect = $2
        getline
+       esc()
        # todo hX, back to top
-       ss[sid] = sprintf("<a name=\"%s\" href=\"#%s\"><h%s>%s</h%s></a>\n", sect, sect, slevel, $0, slevel)
+       ss[sid] = sprintf("<h%s><a name=\"%s\" href=\"#%s\">%s</a></h%s>\n", slevel, sect, sect, $0, slevel)
        if ($0 == "Index")
                ss[sid] = ss[sid] "<pre>\n"
        next
@@ -124,7 +140,7 @@ seencontents && !seenfore && /^[^@]/ {
 /^@end pre/ {
        if (!pre)
                next
-       pre = pre "</pre>\n"
+       pre = pre "\n</pre>\n"
        if (nn)
                note[nn] = note[nn] "\n" pre
        else
@@ -143,18 +159,17 @@ seencontents && !seenfore && /^[^@]/ {
        nn = 0
        p = $2
        getline
-       i = $2
-       ss[sid] = ss[sid] "<!--page " p " indent " i "-->\n"
+       ss[sid] = ss[sid] "<!--page " p " -->\n"
        next
 }
 
 /^@para/ {
-       ss[sid] = ss[sid] "<p><!--para " $2 "-->\n"
+       ss[sid] = ss[sid] "<p><!--para " $2 " -->\n"
        next
 }
 
-/^ *(Syntax|Semantics|Description|Constraints|Synopsis|Returns)$/ {
-       ss[sid] = ss[sid] "<h6>" $0 "</h6>\n"
+/^ ?(Syntax|Semantics|Description|Constraints|Synopsis|Returns|Recommended practice|Implementation limits|Environmental limits)$/ {
+       ss[sid] = ss[sid] "<p><b>" $0 "</b>\n"
        next
 }
 
@@ -203,7 +218,19 @@ seencontents && !seenfore && /^[^@]/ {
        }
        s = p s
        p = ""
-       while (match(s, noteid "\\)")) {
+       # TODO: false positives..
+       while (match(s, /[a-z]opt[ )"]/))
+               s = substr(s,1,RSTART) "<sub>opt</sub>" substr(s,RSTART+RLENGTH-1)
+       if (match(s, /[a-z]opt$/))
+               s = substr(s,1,RSTART) "<sub>opt</sub>"
+       for (;;) {
+               while (match(s, noteid-1 "\\)")) {
+                       p = p substr(s,1,RSTART-1)
+                       p = p "<sup><a href=\"#note" noteid-1 "\"><b>" noteid-1 ")</b></a></sup>"
+                       s = substr(s,RSTART+RLENGTH)
+               }
+               if (!match(s, noteid "\\)"))
+                       break
                if (noteid==1 && s !~ /\.1\)/)
                        break
                p = p substr(s,1,RSTART-1)
@@ -214,6 +241,10 @@ seencontents && !seenfore && /^[^@]/ {
        }
        s = p s
        sub(/^ *Forward references/, "<p><b>&</b>", s)
+       if (markdef) {
+               s = "<b>" s "</b><br>"
+               markdef = 0
+       }
        if (pre)
                pre = pre "\n" s
        else if (nn)
@@ -225,13 +256,13 @@ seencontents && !seenfore && /^[^@]/ {
 END {
        ss[sid] = ss[sid] "</pre>"
 
-       print "<html><head><title>C</title></head><body>"
+       print "<html><head><title>" title "</title></head><body>"
 
        for (i = 1; i <= sid; i++) {
                print ss[i]
                n = split(snote[i],a)
                if (n > 0) {
-                       s = "<h6>footnotes</h6>\n"
+                       s = "<p><b>Footnotes</b>\n"
                        for (j = 1; j <= n; j++) {
                                s = s "<p><small><a name=\"note" a[j] "\" href=\"#note" a[j] "\">" a[j] ")</a>" note[a[j]+0] "</small>\n"
                        }