<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div class="">Hi gentlemen,</div><div class=""><br class=""></div><div class="">Not sure about other platforms, but I’m pretty sure (recent versions of) ACE computes the effect of orthographemic rules like the period in question and places the (non-unification-based) result in ORTH (or grammar-configured path) for the availability of further unification-based processing. &nbsp;Older versions of ACE (say, two years old or more?) do not do this, and leave the ORTH value as whatever the unification constraints supplied by the grammar dictate.</div><div class=""><br class=""></div><div class="">Stephan, do I understand you to say you expect to see an uppercase ORTH before application of w_period_plr and a lowercase ORTH value after? &nbsp;That would seem surprising and unfortunate to me, if perhaps within the formal power of the system if the grammarian truly wanted it...</div><div class=""><br class=""></div><div class="">Regards,</div><div class="">Woodley</div><br class=""><div><blockquote type="cite" class=""><div class="">On Jul 7, 2018, at 2:18 PM, Stephan Oepen &lt;<a href="mailto:oe@ifi.uio.no" class="">oe@ifi.uio.no</a>&gt; wrote:</div><br class="Apple-interchange-newline"><div class=""><div class=""><div class=""><div dir="auto" class="">hi paul,</div></div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">lexical filtering applies after lexical parsing, i.e. you need to make sure your rule matches the complete lexical item—in the case where there is a trailing period, that will be an instance of the ’period‘ lexical rule with the ’bank‘ lexical entry as its daughter.</div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">not quite sure what the orthographemic machinery does about ORTH values, but i suspect that after the application of the ’period‘ the ORTH value may be either unset or (more likely) normalized to all lower case. &nbsp;upon the application of orthographemic (aka spelling-changing) rules, the ORTH value of the mother cannot just be determined by unification, e.g. a re-entrancy into the daughter (as is common for lexical rules that do not affect spelling).</div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">so, to make your current approach work, i think you would have to let the trigger rule detect proper names by a property other than ORTH.</div></div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">alternatively, you could try making ORTH.FIRST re-entrant with TOKENS.+LIST.FIRST.+FORM, so that lexical instantiation will fail against an incoming token feature structure that does not match in case. &nbsp;i have long been thinking this latter technique (as a type addendum on n_-_pn_le) could make a nice stepping stone towards a case-sensitive configuration of the ERG (which might give non-trivial efficiency gains on carefully edited text :-).</div><div dir="auto" class=""><br class=""></div><div dir="auto" class="">best wishes, oe</div><div dir="auto" class=""><br class=""></div><div dir="auto" class=""><br class=""></div><div class=""><div class=""><div class="gmail_quote"><div dir="ltr" class="">On Sat, 7 Jul 2018 at 21:21 &lt;<a href="mailto:paul@haleyai.com" target="_blank" class="">paul@haleyai.com</a>&gt; wrote:<br class=""></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear Developers,<br class="">
<br class="">
In one use case, it would be nice to limit the use of capitalized proper nouns to cases in which the input is capitalized.&nbsp; I have been successful in doing so with some exception, such as shown below.<br class="">
<br class="">
I am surprised by the following behavior and either have something to learn or perhaps there is a bug in PET's chart mapping?<br class="">
<br class="">
Regards,<br class="">
Paul<br class="">
<br class="">
<br class="">
Given a capitalized lexical entry such as:<br class="">
<br class="">
&nbsp; &nbsp; &nbsp; Bank_NNP := n_-_pn_le &amp; [ORTH &lt;"Bank"&gt;,SYNSEM [LKEYS.KEYREL.CARG "Bank",PHON.ONSET con]].<br class="">
<br class="">
The following lexical filtering rule (which has been simplified for the demonstration purposes of this email):<br class="">
<br class="">
&nbsp; &nbsp; &nbsp; veto_capitalized_native_uncapitalized_lfr := lexical_filtering_rule &amp; [+CONTEXT &lt;&gt;,+INPUT &lt;[ORTH.FIRST ^[[:upper:]].*$]&gt;,+OUTPUT &lt;&gt;].<br class="">
<br class="">
will 'correctly' remove Bank_NNP from the chart when the input is "it is the bank" but fails to do so when a period is appended.<br class="">
<br class="">
PET's logging of lexical rules shows as follows for the first case:<br class="">
<br class="">
&nbsp; &nbsp; &nbsp; [cm] veto_capitalized_native_uncapitalized_lfr fired: I1:85 <br class="">
&nbsp; &nbsp; &nbsp; L [85 2-3 the_pn_np1_no (1) -0.1123 {} { : } {}] &lt; blk: 2 dtrs: 50&nbsp; parents: &gt;<br class="">
&nbsp; &nbsp; &nbsp; [cm] veto_capitalized_native_uncapitalized_lfr fired: I1:92 <br class="">
&nbsp; &nbsp; &nbsp; L [92 3-4 Bank_NNP (1) 0 {} { : } {}] &lt; blk: 2 dtrs: 51&nbsp; parents: 98 &gt;<br class="">
&nbsp; &nbsp; &nbsp; [cm] veto_capitalized_native_uncapitalized_lfr fired: I1:98 <br class="">
&nbsp; &nbsp; &nbsp; P [98 3-4 n_sg_ilr (1) 0 {} { : } {}] &lt; blk: 2 dtrs: 92&nbsp; parents: &gt;<br class="">
<br class="">
Surprisingly, only the first of these 3 rules applies in the second case. <br class="">
<br class="">
I don't think it matters, but in our case, input is via FSC in which the period is a token.&nbsp; Thus, the following token mapping rule applies in the second case only:<br class="">
<br class="">
&nbsp; &nbsp; [cm] suffix_punctuation_tmr fired: C1:50 I1:48 O1:51 <br class="">
&nbsp; &nbsp; I [50 () -1--1 &lt;14:15&gt; "" "." { : } {}] &lt; blk: 0 &gt;<br class="">
&nbsp; &nbsp; I [48 () -1--1 &lt;10:14&gt; "" "bank" { : } {}] &lt; blk: 2 &gt;<br class="">
&nbsp; &nbsp; I [51 () -1--1 &lt;10:15&gt; "" "bank." { : } {}] &lt; blk: 0 &gt;<br class="">
<br class="">
A redacted AVM for the surviving lexical item follows. As far as I can tell, it matches the lexical filtering rule above and thus should not remain in the chart.<br class="">
<br class="">
<br class="">
L [103 3-4 Bank_NNP (1) 0 {} { : w_period_plr} {}] &lt; blk: 0 dtrs: 63&nbsp; parents: 110 &gt;<br class="">
n_-_pn_le<br class="">
[ ...<br class="">
&nbsp; SYNSEM&nbsp; &nbsp;...<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;PHON&nbsp; &nbsp;phon<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; [ ONSET con<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; [ --TL #16:native_token_cons<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[ FIRST token<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[ +CLASS #17:alphabetic<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; [ +CASE&nbsp; &nbsp; non_capitalized+lower,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; +INITIAL - ],<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+FROM&nbsp; #3,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+FORM&nbsp; #18:"bank.",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+TO&nbsp; &nbsp; "15",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+CARG&nbsp; "bank",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;...<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;REST&nbsp; native_token_null ] ] ],<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;LKEYS&nbsp; lexkeys_norm<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; [ KEYREL&nbsp; &nbsp; named_nom_relation<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; [ CFROM #3,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; CTO&nbsp; &nbsp;#29:"15",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; PRED&nbsp; named_rel,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; LBL&nbsp; &nbsp;#15,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; LNK&nbsp; &nbsp;*list*,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ARG0&nbsp; #14,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; CARG&nbsp; "Bank" ],<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; ...&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;<br class="">
&nbsp; ORTH&nbsp; &nbsp; &nbsp;orthography<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[ FIRST "Bank",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;REST&nbsp; *null*,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;FROM&nbsp; #3,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;CLASS #17,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;...<br class="">
&nbsp; TOKENS&nbsp; &nbsp;tokens<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[ +LIST #16,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+LAST token<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;[ +CLASS #17,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+FROM&nbsp; "10",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+FORM&nbsp; "bank.",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+TO&nbsp; &nbsp; #29,<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;+CARG&nbsp; "bank",<br class="">
&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;...<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
<br class="">
</blockquote></div></div>
</div>
</div></blockquote></div><br class=""></body></html>