G&#39;day,<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
jointly with peter and dan, we are nearing completion on a first public<br>
release of the new `chart mapping&#39; machinery (see Adolphs et al., 2008,<br>
at LREC). &nbsp;in this context, we would like to add a syntax extension for<br>
regular expressions to TDL. &nbsp;we were tempted to use /[a-z]+/, much like<br>
in awk, perl, et al. &nbsp;but the slash is already in use for defaults (in<br>
the LKB).<br>
<br>
our current proposal is ^[a-z]+$, i.e. delimit regular expressions with<br>
an opening cap and a closing dollar sign. &nbsp;the rationale, here, is that<br>
we assume regular expressions to be implicitly anchored anyway (hence,<br>
to match a sub-string, a pattern will have to be padded: ^.*[a-z]+.*$).</blockquote><div><br>Do we gain anything by having separate symbols for start and end?&nbsp; I would have thought ^regexp^ can do the job just as well, without taking up another precious character :-).<br>
&nbsp;</div></div><br clear="all"><br>-- <br>Francis Bond &lt;<a href="http://www2.nict.go.jp/x/x161/en/member/bond/">http://www2.nict.go.jp/x/x161/en/member/bond/</a>&gt;<br>NICT Language Infrastructure Group<br>