digraphs: encode data include directly as json
[sheet.git] / digraphs.plp
1 <(common.inc.plp)><:
2
3 my $mode = ($Request // '') eq 'xorg' || exists $get{xorg};
4 my $modename = $mode ? 'X.Org' : 'RFC-1345';
5
6 Html({
7         title => 'digraph cheat sheet',
8         version => '1.3',
9         description => [
10                 "Complete table of digraph characters from $modename.",
11         ],
12         keywords => [qw'
13                 digraph mnemonic compose composition pair
14                 character char glyph table unicode vim xorg x11 x
15         '],
16         stylesheet => [qw'light'],
17         data => [qw( data/digraphs.inc.pl )],
18 });
19
20 :>
21 <h1><:= $modename :> Digraphs</h1>
22
23 <p>Character mnemonics following compose key ⎄<:
24 say join("\n",
25         $mode ? (
26                 ' in the X Window System (Shift+AltGr by default).',
27                 'Differences from <a href="/digraphs">RFC-1345</a> are indicated.',
28         ) : (':',
29                 'i^k in <a href="/vi">Vim</a>,',
30                 '^u^\ in <a href="/readline">Emacs</a>,',
31                 '^a^v in <a href="/screen">Screen</a>.',
32                 'Similar but different from <a href="/digraphs/xorg">X.Org</a>.',
33         ),
34         'Also see <a href="/unicode">common Unicode</a>.</p>',
35 );
36 say '<p class="aside">Unofficial <span class="u-l2">proposals</span>',
37         ' are available as <a href="/digraphs.vim">ex commands</a>.' if not $mode;
38 :>
39
40 <:
41 my $di = Data('digraphs');
42
43 if (exists $get{v}) {
44         # show characters for inverted mnemonics (vim alternatives)
45         $di->{ substr($_, 1, 1) . substr($_, 0, 1) } ||=
46                 [ $di->{$_}->[0], '', 'l0 ex', '', $di->{$_}->[4] ]
47                 for grep { ref $di->{$_} } keys %{$di};
48 }
49
50 my @chars = (
51         [qw{! " % ' ( ) * + , - . /}],
52         ['0'..'9'], [qw{: ; < = > ?}],
53         ['A'..'M'], ['N'..'Z'],
54         ['a'..'m'], ['n'..'z'],
55 );
56 my @chars2 = (['_'], @chars);  # trailing character (extended set)
57 my @columns = !exists $get{split} ? \@chars2 :
58         ([@chars2[0, 1, 3, 4, 6]], [@chars2[2, 5, 7]]);
59
60 if ($mode) {
61         my $xorg = Data('data/digraphs-xorg');
62         $_ = [ord $_] for values %{$xorg};
63         $xorg->{$_}->[2] = # class = compatibility
64                 $di->{$_} ? $di->{$_}->[0] != $xorg->{$_}->[0] ? 'l1' :  # conflict
65                 $di->{$_}->[2] eq 'l4' ? 'l5' : 'l3' : 'l2'  # rfc|any|none
66                 for keys %{$xorg};
67
68         for my $cp (map {$_->[0]} values %{$xorg}) {
69                 next if (state $seen = {})->{$cp}++;  # List::MoreUtils::uniq
70
71                 # find multiple equivalent mnemonics
72                 my @equiv = grep {$cp eq $_->[0]}
73                         map {$xorg->{$_}} sort keys %{$xorg}; # values ordered by mnem.
74
75                 # search for the most compatible match
76                 my ($compat) = sort {
77                         $equiv[$b]->[2] cmp $equiv[$a]->[2]  # highest level
78                         || $b <=> $a  # fallback to last mnemonic
79                 } 0 .. $#equiv;
80
81                 # reclassify all but one as level 0 (omitted)
82                 splice @equiv, $compat // -1, 1, ();
83                 $_->[2] = 'l0 ex' for @equiv;
84         }
85
86         $chars2[0] = [qw( # ^ _ ` ~ )];
87         @chars = @chars2;
88         $di = $xorg;
89 }
90
91 for my $colchars (@columns) {
92 print '<table class="glyphs dimap"><col>';
93 print qq'<colgroup span="$_">' for map {scalar @$_} @{$colchars};
94 say '</colgroup><col>';
95 for my $section (qw{thead tfoot}) {
96         print "<$section><tr><th>↳";
97         print '<th>', EscapeHTML($_) for map {@$_} @{$colchars};
98         say '<th>&nbsp;';
99 }
100 for my $c1group (@chars) {
101         print '<tbody>';
102         for my $c1 (@$c1group) {
103                 print '<tr><th>', EscapeHTML($c1);
104                 for my $c2 (map {@$_} @$colchars) {
105                         my $mnem = $c1 . $c2;
106                         if (not defined $di->{$mnem}) {
107                                 print '<td>';
108                                 next;
109                         }
110                         if (ref $di->{$mnem} ne 'ARRAY') {
111                                 printf '<td class="X Xr" title="%s">', EscapeHTML($mnem);
112                                 next;
113                         }
114                         my ($codepoint, $name, $support, $script, $string) = @{ $di->{$mnem} };
115
116                         my $glyph = $string || chr $codepoint;
117                         utf8::upgrade($glyph);  # prevent latin1 output
118                         my $desc = $mnem . ($name && " ($name)");
119                         my @class = ('X', grep {$_} $script);
120                         push @class, $mode ? $support : "u-$support" if $support;
121
122                         $glyph = EscapeHTML($glyph);
123                         $glyph = "<span>$glyph</span>" if $script =~ /\bZs\b/;
124
125                         printf "\n".'<td class="%s" title="%s">%s',
126                                 join(' ', @class), EscapeHTML($desc), $glyph;
127                 }
128                 say "\n<th>", EscapeHTML($c1);
129         }
130 }
131 say '</table>';
132 print '<hr>' if exists $get{split};
133 }
134
135 if ($mode) {
136 :>
137 <div class="legend">
138         <table class="glyphs"><tr>
139         <td class="X l5">matching RFC-1345
140         <td class="X l3">matching proposal
141         <td class="X l2">unique to Xorg
142         <td class="X l1">conflict
143         <td class="X l0 ex">duplicate
144         </table>
145 </div>
146 <: } else { :>
147 <div class="legend">
148         <table class="glyphs"><tr>
149         <td class="X Cc">control
150         <td class="X Zs"><span>space</span>
151         <td class="X Mn">combining
152         <td class="X Sk">spacing&nbsp;modifier
153         <td class="X Pf">quote
154         <td class="X Po">punctuation
155         <td class="X So">symbol
156         <td class="X Sm">math
157         <td class="X Sc">currency
158         <td class="X No">numeric
159         <td class="X Greek">greek
160         <td class="X Cyrillic">cyrillic
161         <td class="X Latin">latin
162         <td class="X Hebrew">hebrew
163         <td class="X Arabic">arabic
164         <td class="X Hangul">korean
165         <td class="X Hiragana">japanese
166         <td class="X Bopomofo">chinese
167         </table>
168
169         <table class="glyphs"><tr>
170         <td class="X u-l4">full support
171         <td class="X u-l3">vim extension
172         <td class="X u-l3 ex">vim v8.0
173         <td class="X u-l2">proposal
174         <td class="X u-l1">not in vim
175         </table>
176 </div>
177
178 <: }