<div dir="ltr"><div class="gmail_default" style="font-family:arial,helvetica,sans-serif">Hi developers,</div><div class="gmail_default" style="font-family:arial,helvetica,sans-serif"><br></div><div class="gmail_default" style="font-family:arial,helvetica,sans-serif">I ran a test to see how compatible our REPP implementations are. I tested the following:</div><div class="gmail_default" style="font-family:arial,helvetica,sans-serif"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">* $LOGONROOT/bin/repp standalone tool<br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">* PyDelphin&#39;s `delphin repp` </div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">* ace -Ev (with some `sed` and `awk` to format it like the others)</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">I ran these over all i-input fields in the ERG&#39;s tsdb/gold profiles and diffed the outputs respective to the output of the REPP standalone tool.</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"> There were 3 issues with PyDelphin:</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">1. Characterization wasn&#39;t accounting for deletions without replacement</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">2. Inline regex flags (such as (?i) in a group) apply to the whole match in Python</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">3. External group calls (such as &gt;wiki) are non-iterative</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">Once I resolved the first issue, PyDelphin only differs from REPP in 6 items. The second issue is a Python thing and I think I have a way around it. The third one is more troubling, because it appears that ACE and REPP both apply external group calls iteratively even though the ReppTop wiki is clear that they are should not be iterative. If someone can confirm that the wiki is incorrect, I&#39;ll update PyDelphin to treat them as iterative as well. See <a href="https://github.com/delph-in/pydelphin/issues/254">https://github.com/delph-in/pydelphin/issues/254</a> for more info.<br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default">ACE has diffs in 1410 items, which appear to be mostly whether the conversion from two hyphens to an en-dash, two quotes to an angled quote, ... to an ellipsis character, etc., count as a span of 1 vs 2 or 3. There were some other issues but this appears to be the main one.</div><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"></div><div class="gmail_default" style="font-family:arial,helvetica,sans-serif"><div style="font-family:arial,helvetica,sans-serif" class="gmail_default"><br></div></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">-Michael Wayne Goodman</div></div>