<div dir="ltr">Thanks for confirming. So far I am finding that the C++ version does indeed return better characterization than the other ones I&#39;ve tried, although some corner cases with inserted characters are surprising.<br><br>Also, the C++ version uses PCRE regexes for matching but apparently not for substitution. It only substitutes numbered groups (e.g., \1, \2, etc.), and not named capture groups (e.g., \g{name}, \g&lt;name&gt;, \k&lt;name&gt;, etc.), or numbered groups over 9 (e.g., \g{10}). I&#39;m not suggesting that the code needs to be fixed, but the limitation may need to be documented, e.g., on the wiki (which I can do once the limitation is confirmed).<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Apr 26, 2018 at 2:09 PM, Stephan Oepen <span dir="ltr">&lt;<a href="mailto:oe@ifi.uio.no" target="_blank">oe@ifi.uio.no</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>the lisp implementation is very much used, but i would put my money on the C++ version regarding correct characterization, if there were disagreement in corner cases.</div></div><div dir="auto"><br></div><div dir="auto">oe</div><div class="HOEnZb"><div class="h5"><div dir="auto"><br></div><div><br><div class="gmail_quote"><div>On Thu, 26 Apr 2018 at 22:46 Michael Wayne Goodman &lt;<a href="mailto:goodmami@uw.edu" target="_blank">goodmami@uw.edu</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>Thank you for the advice, Stephan. For context, I&#39;m comparing the REPP implementations I know about (Lisp (LKB), C++ (PET), C (ACE), C# (agree)) in order to inform the design of my own Python implementation. Would you consider the Lisp implementation to be abandoned or deprecated, or is it perhaps still used by the LKB?<br></div><div class="gmail_extra"></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Apr 26, 2018 at 1:30 PM, Stephan Oepen <span>&lt;<a href="mailto:oe@ifi.uio.no" target="_blank">oe@ifi.uio.no</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div><div dir="auto">hi mike,</div><div dir="auto"><br></div><div dir="auto">i would strongly advise you use the C++ implementation of REPP as your reference.  it implements the right way of determining character ranges across deletion and substitution rules, as introduced in dridan &amp; oepen (2012):</div><div dir="auto"><br></div><div dir="auto"><div><a href="https://aclanthology.info/papers/P12-2074/p12-2074" target="_blank">https://aclanthology.info/<wbr>papers/P12-2074/p12-2074</a></div><br></div><div dir="auto">the LKB implementation predates that work and is known to be deficient about its characterization in corner cases.</div><div dir="auto"><br></div><div dir="auto">best wishes, oe</div></div></div><div class="m_-1350584908448117440m_3517408759152540691HOEnZb"><div class="m_-1350584908448117440m_3517408759152540691h5"><div><div><div dir="auto"><br></div><br><div class="gmail_quote"><div>On Thu, 26 Apr 2018 at 21:45 Michael Wayne Goodman &lt;<a href="mailto:goodmami@uw.edu" target="_blank">goodmami@uw.edu</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>Hello,<br><br></div>Does anyone know a good way to invoke the LKB&#39;s REPP implementation from the command line (i.e., just tokenization, no parsing)? I&#39;m currently doing this:<br><br clear="all"><div><div>    $ &quot;${LOGONROOT}/&quot;bin/logon --tty &lt;&lt;&lt; &quot;(lkb::read-repp \&quot;testrpp/test.rpp\&quot;)(lkb::<wbr>repp \&quot;abab\&quot;)&quot;<br><br></div><div>It works, but I get a bunch of Lisp messages that I&#39;m having trouble filtering.<br><br>    International Allegro CL Enterprise Edition<br>    10.0 [64-bit Linux (x86-64)] (Jun 10, 2017 21:22)<br>    ...<br>    Really exit lisp [n]?<br><br></div><div>The output I want is within the &quot;...&quot; above. The messages are not on stderr, so I can&#39;t just redirect 2&gt;/dev/null.<br><br></div><div>Thanks for any help<br><br></div></div></div><div><div><div>-- <br><div class="m_-1350584908448117440m_3517408759152540691m_2494145185636808559m_-8438282717570707229m_4942738515424248792gmail_signature"><div><div><div><div><div>Michael Wayne Goodman</div></div></div></div></div></div>
</div></div></div></blockquote></div></div></div>
</div></div></blockquote></div><br><br clear="all"><br></div><div class="gmail_extra">-- <br><div class="m_-1350584908448117440m_3517408759152540691gmail_signature" data-smartmail="gmail_signature"><div><div><div><div><div>Michael Wayne Goodman</div></div></div></div></div></div>
</div></blockquote></div></div>
</div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr">Michael Wayne Goodman</div></div></div></div></div></div>
</div>