expand backend documentation
[perl/plp/.git] / PLP.pm
1 package PLP;
2
3 use 5.006;
4
5 use PLP::Functions ();
6 use PLP::Fields;
7 use PLP::Tie::Headers;
8 use PLP::Tie::Delay;
9 use PLP::Tie::Print;
10
11 use File::Basename ();
12 use File::Spec;
13
14 use strict;
15
16 our $VERSION = '3.19';
17
18 # Subs in this package:
19 #  _default_error($plain, $html)    Default error handler
20 #  clean                            Reset variables
21 #  error($error, $type)             Handle errors
22 #  everything                       Do everything: CGI
23 #  handler($r)                      Do everything: mod_perl
24 #  sendheaders                      Send headers
25 #  source($path, $level, $linespec) Read and parse .plp files
26 #  start                            Start the initialized PLP script
27
28 # The _init subs do the following:
29 #  Set $PLP::code to the initial code
30 #  Set $ENV{PLP_*} and make PATH_INFO if needed
31 #  Change the CWD
32
33 # This gets referenced as the initial $PLP::ERROR
34 sub _default_error {
35         my ($plain, $html) = @_; 
36         print qq{<table border=1 class="PLPerror"><tr><td>},
37               qq{<b>Debug information:</b><br>$html</td></tr></table>};
38 }
39
40 # This cleans up from previous requests, and sets the default $PLP::DEBUG
41 sub clean {
42         @PLP::END = ();
43         $PLP::code = '';
44         $PLP::sentheaders = 0;
45         $PLP::DEBUG = 1;
46         $PLP::print = '';
47         delete @ENV{ grep /^PLP_/, keys %ENV };
48 }
49
50 # Handles errors, uses subref $PLP::ERROR (default: \&_default_error)
51 sub error {
52         my ($error, $type) = @_;
53         if (not defined $type or $type < 100) {
54                 return undef unless $PLP::DEBUG & 1;
55                 my $plain = $error;
56                 (my $html = $plain) =~ s/([<&>])/'&#' . ord($1) . ';'/ge;
57                 PLP::sendheaders() unless $PLP::sentheaders;
58                 $PLP::ERROR->($plain, $html);
59         } else {
60                 select STDOUT;
61                 my ($short, $long) = @{
62                         +{
63                                 404 => [
64                                         'Not Found',
65                                         "The requested URL $ENV{REQUEST_URI} was not found " .
66                                         "on this server."
67                                 ],
68                                 403 => [
69                                         'Forbidden',
70                                         "You don't have permission to access $ENV{REQUEST_URI} " .
71                                         "on this server."
72                                 ],
73                         }->{$type}
74                 };
75                 print "Status: $type\nContent-Type: text/html\n\n",
76                         qq{<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">\n<html>},
77                         "<head>\n<title>$type $short</title>\n</head></body>\n<h1>$short",
78                         "</h1>\n$long<p>\n<hr>\n$ENV{SERVER_SIGNATURE}</body></html>";
79         }
80 }
81
82 # Wrap old request handlers.
83 sub everything {
84         require PLP::Backend::CGI;
85         PLP::Backend::CGI::everything();
86 }
87 sub handler {
88         require PLP::Backend::Apache;
89         PLP::Backend::Apache::handler(@_);
90 }
91
92 # Sends the headers waiting in %PLP::Script::header
93 sub sendheaders () {
94         $PLP::sentheaders ||= [ caller 1 ? (caller 1)[1, 2] : (caller)[1, 2] ];
95         print STDOUT "Content-Type: text/plain\n\n" if $PLP::DEBUG & 2;
96         print STDOUT map("$_: $PLP::Script::header{$_}\n", keys %PLP::Script::header), "\n";
97 }
98
99 {
100         my %cached; # Conceal cached sources: ( path => [ [ deps ], source, -M ] )
101         
102         # Given a filename and optional level (level should be 0 if the caller isn't
103         # source() itself), and optional linespec (used by PLP::Functions::Include),
104         # this function parses a PLP file and returns Perl code, ready to be eval'ed
105         sub source {
106                 my ($file, $level, $linespec, $path) = @_;
107                 our $use_cache;
108
109                 # $file is displayed, $path is used. $path is constructed from $file if
110                 # not given.
111
112                 $level = 0      unless defined $level;
113                 $linespec = '1' unless defined $linespec;
114                 
115                 if ($level > 128) {
116                         %cached = ();
117                         return $level
118                                 ? qq{\cQ; die qq[Include recursion detected]; print q\cQ}
119                                 : qq{\n#line $linespec\ndie qq[Include recursion detected];};
120                 }
121
122                 my $in_block = 0;   # 1 => "<:", 2 => "<:="
123                 
124                 $path ||= File::Spec->rel2abs($file);
125                 
126                 my $source_start = $level
127                         ? qq/\cQ;\n#line 1 "$file"\n$PLP::print q\cQ/
128                         : qq/\n#line 1 "$file"\n$PLP::print q\cQ/;
129                 
130                 if ($use_cache and exists $cached{$path}) {
131                         BREAKOUT: {
132                                 my @checkstack = ($path);
133                                 my $item;
134                                 my %checked;
135                                 while (defined(my $item = shift @checkstack)) {
136                                         next if $checked{$item};
137                                         last BREAKOUT if $cached{$item}[2] > -M $item;
138                                         $checked{$item} = 1;
139                                         push @checkstack, @{ $cached{$item}[0] }
140                                                 if @{ $cached{$item}[0] };
141                                 }
142                                 return $level
143                                         ? $source_start . $cached{$path}[1]
144                                         : $source_start . $cached{$path}[1] . "\cQ";
145                         }
146                 }
147
148                 $cached{$path} = [ [ ], undef, undef ] if $use_cache;
149                 
150                 my $linenr = 0;
151                 my $source = '';
152
153                 local *SOURCE;
154                 open SOURCE, '<', $path or return $level
155                         ? qq{\cQ; die qq[Can't open "\Q$path\E" (\Q$!\E)]; print q\cQ}
156                         : qq{\n#line $linespec\ndie qq[Can't open "\Q$path\E" (\Q$!\E)];};
157                 
158                 LINE:
159                 while (defined (my $line = <SOURCE>)) {
160                         $linenr++;
161                         for (;;) {
162                                 $line =~ /
163                                         \G                  # Begin where left off
164                                         ( \z                # End
165                                         | <:=? | :>         # PLP tags     <:= ... :> <: ... :>
166                                         | <\([^)]*\)>       # Include tags <(...)>
167                                         | <[^:(][^<:]*      # Normal text
168                                         | :[^>][^<:]*       # Normal text
169                                         | [^<:]*            # Normal text
170                                         )
171                                 /gxs;
172                                 next LINE unless length $1;
173                                 my $part = $1;
174                                 if ($part eq '<:=' and not $in_block) {
175                                         $in_block = 2;
176                                         $source .= "\cQ, (";
177                                 } elsif ($part eq '<:' and not $in_block) {
178                                         $in_block = 1;
179                                         $source .= "\cQ; ";
180                                 } elsif ($part eq ':>' and $in_block) {
181                                         $source .= (
182                                                 $in_block == 2
183                                                         ? "), q\cQ"              # 2
184                                                         : "; $PLP::print q\cQ"   # 1
185                                         );
186                                         $in_block = 0;
187                                 } elsif ($part =~ /^<\((.*?)\)>\z/ and not $in_block) {
188                                         my $ipath = File::Spec->rel2abs(
189                                                 $1, File::Basename::dirname($path)
190                                         );
191                                         $source .= source($1, $level + 1, undef, $ipath) .
192                                                    qq/\cQ, \n#line $linenr "$file"\nq\cQ/;
193                                         push @{ $cached{$path}[0] }, $ipath;
194                                 } else {
195                                         $part =~ s/\\/\\\\/ unless $in_block;
196                                         $source .= $part;
197                                 }
198                         }
199                 }
200                 
201                 if ($in_block) {
202                         $source .= (
203                                 $in_block == 2
204                                         ? "), q\cQ"              # 2
205                                         : "; $PLP::print q\cQ"   # 1
206                         );
207                 }
208
209                 if ($use_cache) {
210                         $cached{$path}[1] = $source;
211                         $cached{$path}[2] = -M $path;
212                 }
213
214                 return $level
215                         ? $source_start . $source
216                         : $source_start . $source . "\cQ";
217         }
218 }
219
220
221 # Let the games begin! No lexicals may exist at this point.
222 sub start {
223         no strict;
224         tie *PLPOUT, 'PLP::Tie::Print';
225         select PLPOUT;
226         $PLP::ERROR = \&_default_error;
227
228         PLP::Fields::doit();
229         {
230                 package PLP::Script;
231                 use vars qw(%headers %header %cookies %cookie %get %post %fields);
232                 *headers = \%header;
233                 *cookies = \%cookie;
234                 PLP::Functions->import();
235
236                 # No lexicals may exist at this point.
237                 
238                 eval qq{ package PLP::Script; $PLP::code; };
239                 PLP::error($@, 1) if $@ and $@ !~ /\cS\cT\cO\cP/;
240
241                 eval   { package PLP::Script; $_->() for reverse @PLP::END };
242                 PLP::error($@, 1) if $@ and $@ !~ /\cS\cT\cO\cP/;
243         }
244         PLP::sendheaders() unless $PLP::sentheaders;
245         select STDOUT;
246         undef *{"PLP::Script::$_"} for keys %PLP::Script::;
247         # Symbol::delete_package('PLP::Script');
248         # The above does not work. TODO - find out why not.
249 }
250
251 1;
252
253 =head1 NAME
254
255 PLP - Perl in HTML pages
256
257 =head1 SYNOPSIS
258
259 =head2 Lighttpd installation
260
261 F<lighttpd.conf> configuration using L<mod_fastcgi|PLP::Backend::FastCGI>:
262
263     server.modules = (
264         "mod_fastcgi",
265     )
266     fastcgi.server = (
267         ".plp" => ((
268                     "bin-path" => "/usr/bin/perl -MPLP::Backend::FastCGI",
269                     "socket" => "/tmp/fcgi-plp.socket",
270                   )),
271     )
272
273 =head2 Apache installation
274
275 F<httpd.conf> for a L<mod_perl|PLP::Backend::Apache> setup:
276
277     <Files *.plp>
278         SetHandler perl-script
279         PerlHandler PLP::Backend::Apache
280         PerlSendHeader On
281     </Files>
282
283 =head2 Test script (test.plp)
284
285     <html><body>
286     <:
287         print "Hurrah, it works!<br>" for 1..10;
288     :>
289     </body></html>
290
291 =head1 DESCRIPTION
292
293 PLP is yet another Perl embedder, primarily for HTML documents. Unlike with
294 other Perl embedders, there is no need to learn a meta-syntax or object
295 model: one can just use the normal Perl constructs. PLP runs under
296 L<FastCGI|PLP::Backend::FastCGI> and L<mod_perl|PLP::Backend::Apache>
297 for speeds comparable to those of PHP, but can also be run as a standard
298 L<CGI|PLP::Backend::CGI> script.
299
300 =head2 Setup
301
302 See either
303 L<CGI|PLP::Backend::CGI>,
304 L<FastCGI|PLP::Backend::FastCGI> (recommended)
305 or L<Apache|PLP::Backend::Apache>.
306 At least the following servers are supported:
307
308 =over 10
309
310 =item Lighttpd
311
312 With L<mod_fastcgi|PLP::Backend::FastCGI> or L<mod_cgi|PLP::Backend::CGI>.
313
314 =item Apache
315
316 Either version 1 or 2. Using
317 L<mod_fcgid, mod_fastcgi|PLP::Backend::FastCGI>,
318 L<mod_perl|PLP::Backend::Apache>,
319 or L<mod_action|PLP::Backend::CGI>.
320
321 =back
322
323 =head2 PLP Syntax
324
325 =over 22
326
327 =item C<< <: perl_code(); :> >>
328
329 With C<< <: >> and C<< :> >>, you can add Perl code to your document. This is
330 what PLP is all about. All code outside of these tags is printed. It is
331 possible to mix perl language constructs with normal HTML parts of the document:
332
333     <: unless ($ENV{REMOTE_USER}) { :>
334         You are not logged in.
335     <: } :>
336
337 C<< :> >> always stops a code block, even when it is found in a string literal.
338
339 =item C<< <:= $expression :> >>
340
341 Includes a dynamic expression in your document. The expression is evaluated in
342 list context. Please note that the expression should not end a statement: avoid
343 semi-colons. No whitespace may be between C<< <: >> and the equal sign.
344
345 C<< foo <:= $bar :> $baz >> is like C<< <: print 'foo ', $bar, ' $baz'; :> >>.
346
347 =item C<< <(filename)> >>
348
349 Includes another file before the PLP code is executed. The file is included
350 literally, so it shares lexical variables. Because this is a compile-time tag,
351 it's fast, but you can't use a variable as the filename. You can create
352 recursive includes, so beware! (PLP will catch simple recursion: the maximum
353 depth is 128.) Whitespace in the filename is not ignored so C<< <( foo.txt)> >>
354 includes the file named C< foo.txt>, including the space in its name. A
355 compile-time alternative is include(), which is described in L<PLP::Functions>.
356
357 =back
358
359 =head2 PLP Functions
360
361 These are described in L<PLP::Functions>.
362
363 =head2 PLP Variables
364
365 =over 22
366
367 =item $ENV{PLP_NAME}
368
369 The URI of the PLP document, without the query string. (Example: C</foo.plp>)
370
371 =item $ENV{PLP_FILENAME}
372
373 The filename of the PLP document. (Example: C</var/www/index.plp>)
374
375 =item $PLP::VERSION
376
377 The version of PLP.
378
379 =item $PLP::DEBUG
380
381 Controls debugging output, and should be treated as a bitmask. The least
382 significant bit (1) controls if run-time error messages are reported to the
383 browser, the second bit (2) controls if headers are sent twice, so they get
384 displayed in the browser. A value of 3 means both features are enabled. The
385 default value is 1.
386
387 =item $PLP::ERROR
388
389 Contains a reference to the code that is used to report run-time errors. You
390 can override this to have it in your own design, and you could even make it
391 report errors by e-mail. The sub reference gets two arguments: the error message
392 as plain text and the error message with special characters encoded with HTML 
393 entities.
394
395 =item %header, %cookie, %get, %post, %fields
396
397 These are described in L<PLP::Fields>.
398
399 =back
400
401 =head2 Things that you should know about
402
403 Not only syntax is important, you should also be aware of some other important
404 features. Your script runs inside the package C<PLP::Script> and shouldn't
405 leave it. This is because when your script ends, all global variables in the
406 C<PLP::Script> package are destroyed, which is very important if you run under
407 mod_perl (they would retain their values if they weren't explicitly destroyed).
408
409 Until your first output, you are printing to a tied filehandle C<PLPOUT>. On
410 first output, headers are sent to the browser and C<STDOUT> is selected for
411 efficiency. To set headers, you must assign to C<$header{ $header_name}> before
412 any output. This means the opening C<< <: >> have to be the first characters in
413 your document, without any whitespace in front of them. If you start output and
414 try to set headers later, an error message will appear telling you on which
415 line your output started. An alternative way of setting headers is using Perl's
416 BEGIN blocks. BEGIN blocks are executed as soon as possible, before anything
417 else.
418
419 Because the interpreter that mod_perl uses never ends, C<END { }> blocks won't
420 work properly. You should use C<PLP_END { };> instead. Note that this is a not
421 a built-in construct, so it needs proper termination with a semi-colon (as do
422 C<eval> and C<do>).
423
424 Under mod_perl, modules are loaded only once. A good modular design can improve
425 performance because of this, but you will have to B<reload> the modules
426 yourself when there are newer versions. 
427
428 The special hashes are tied hashes and do not always behave the way you expect,
429 especially when mixed with modules that expect normal CGI environments, like
430 CGI.pm. Read L<PLP::Fields> for information more about this.
431
432 =head1 FAQ and HowTo
433
434 A lot of questions are asked often, so before asking yours, please read the 
435 FAQ at L<PLP::FAQ>. Some examples can be found at L<PLP::HowTo>.
436
437 =head1 NO WARRANTY
438
439 No warranty, no guarantees. Use PLP at your own risk, as I disclaim all
440 responsibility.
441
442 =head1 AUTHORS
443
444 Currently maintained by Mischa POSLAWSKY <perl@shiar.org>
445
446 Originally by Juerd Waalboer <juerd@cpan.org>
447
448 =head1 SEE ALSO
449
450 L<PLP::Functions>, L<PLP::Fields>, L<PLP::FAQ>, L<PLP::HowTo>
451
452 =cut
453
454 ### Garbage bin
455
456 # About the #S lines:
457 # I wanted to implement Safe.pm so that scripts were run inside a
458 # configurable compartment. This needed for XS modules to be pre-loaded,
459 # hence the PLPsafe_* Apache directives. However, $safe->reval() lets
460 # Apache segfault. End of fun. The lines are still here so that I can
461 # s/^#S //g to re-implement them whenever this has been fixed.
462
463 #S # For PLPsafe scripts
464 #S sub safe_eval {
465 #S     my ($r, $code) = @_;
466 #S     $r->send_http_header('text/plain');
467 #S     require Safe;
468 #S     unless ($PLP::safe) {
469 #S      $PLP::safe = Safe->new('PLP::Script');
470 #S      for ( map split, $r->dir_config->get('PLPsafe_module') ) {
471 #S          $PLP::safe->share('*' . $_ . '::');
472 #S          s!::!/!g;
473 #S          require $_ . '.pm';
474 #S      }
475 #S      $PLP::safe->permit(Opcode::full_opset());
476 #S      $PLP::safe->deny(Opcode::opset(':dangerous'));
477 #S     }
478 #S     $PLP::safe->reval($code);
479 #S }
480 #S  my ($r) = @_;
481
482 # start()
483 #S      if ($PLP::use_safe) {
484 #S          PLP::safe_eval($r, $PLP::code);
485 #S      } else {
486 #           eval qq{ package PLP::Script; $PLP::code; };
487 #S      }
488 #       PLP::error($@, 1) if $@ and $@ !~ /\cS\cT\cO\cP/;
489 #S      if ($PLP::use_safe) {
490 #S          PLP::safe_eval($r, '$_->() for reverse @PLP::END');
491 #S      } else {
492 #           eval   { package PLP::Script; $_->() for reverse @PLP::END };
493 #S      }
494 #       PLP::error($@, 1) if $@ and $@ !~ /\cS\cT\cO\cP/;
495
496 ###