<html><body bgcolor="#FFFFFF"><div><div>hi paul,</div><div><br></div><div>as bec points out, unknown word handling in the ERG is tightly linked to (a) PoS tags on input tokens, to activate compatible generic lexical entries and (b) chart mapping, to apply light-weight NE recognition, e.g. numbers and such.</div><div><br></div><div>in your example, i assume there were no PoS tags, nor do any of the NE heuristics fire (sentence-initial capitals do /not/ trigger unknown names); hence, i would indeed expect the behavior you report.</div><div><br></div><div>that your unknown tokens trigger unknown words when chart mapping is disabled (which really no longer is a supported configuration for the ERG, i.e. something i would strongly advise against) probably is owed to to your FSC inputs leaving the PoS list in the token FSs underspecified. &nbsp;chart mapping will ‘tighten’ such underspecification to an empty list, which will then block activation of PoS-based generics.</div><div><br></div><div>if you really wanted all generics for all unknown words (which i would not expect to scale beyond relatively short sentences), i concur with bec: you would have to adapt the chart mapping rules in (minimally) ‘tmr/tnt.tdl’—or maybe change the generics to have an empty PoS list?</div><div><br></div><div>best, oe<br><br></div><div><br>On 30. mars 2012, at 18:55, Paul Haley &lt;<a href="mailto:paul@haleyai.com"><a href="mailto:paul@haleyai.com">paul@haleyai.com</a></a>&gt; wrote:<br><br></div><div></div><blockquote type="cite"><div>

    Here's a dump of the issue, FYI.&nbsp; <br>
    <br>
    <br>
    Essentially, PET appears not to maintain the MRS linkage to tokens
    if either generics are involved or chart mapping is not used, which
    seems inappropriate in either case.<br>
    <br>
    <br>
    With chart mapping, undefined words are not recognized:<br>
    <blockquote>build/debug/cheap/cheap (0.99.14svn_cm $Change: 850 $)
      -nsolutions=1 -verbose=4 -mrs=new -default-les=all -cm
      ../ERG/english.grm<br>
      <br>
      Eukaryotic cells contain mitochondria.<br>
      ...<br>
      no lexicon entries for:<br>
      &nbsp;&nbsp;&nbsp; "eukaryotic"<br>
      &nbsp;&nbsp;&nbsp; "mitochondria."<br>
      ...<br>
    </blockquote>
    Without chart mapping the words are recognized but the MRS loses
    reference to the chart (i.e., by token position):<br>
    <br>
    <blockquote>Eukaryotic cells contain mitochondria.<br>
      ...<br>
      &lt;mrs&gt;<br>
      &lt;label vid='1'/&gt;&lt;var vid='2'/&gt;<br>
      &lt;ep cfrom='-1'
      cto='-1'&gt;&lt;pred&gt;UNKNOWN_REL&lt;/pred&gt;&lt;label
      vid='1'/&gt;<br>
      ...<br>
    </blockquote>
    The following shows that when the words are known to the ERG the MRS
    has the position information in chart mapping mode:<br>
    <br>
    <blockquote>this is a test.<br>
      ...<br>
      &lt;mrs&gt;<br>
      &lt;label vid='1'/&gt;&lt;var vid='2'/&gt;<br>
      &lt;ep cfrom='0'
      cto='1'&gt;&lt;pred&gt;GENERIC_ENTITY_REL&lt;/pred&gt;&lt;label
      vid='3'/&gt;<br>
      ...<br>
      <br>
    </blockquote>
    Thanks again, and sorry for omitting the detail from the prior
    email.<br>
    <br>
    Paul<br>
    <blockquote><br>
      On 03/30/2012 11:55 AM, Paul Haley wrote:</blockquote>
    <blockquote cite="mid:4F75D77C.4020403@haleyai.com" type="cite">
      
      Hello again,<br>
      <br>
      I was able to isolate the change in my environment to the use of
      the chart mapping option.<br>
      <br>
      Apparently, the from/to attributes of the MRS (shown here around a
      colon) are -1 unless chart-mapping is selected: <br>
      <br>
      &nbsp;&nbsp;&nbsp; [ LTOP: h1&nbsp; INDEX: e2 [ e SF: PROP TENSE: PAST MOOD:
      INDICATIVE PROG: - PERF: - ]&nbsp; RELS: &lt;&nbsp;&nbsp; [ appos_rel&lt;0:36&gt;<br>
      <br>
      I dropped the -cm intending to receive the explosion of generics
      discussed in the "unknown word handling and chart mapping section"
      of <a moz-do-not-send="true" class="moz-txt-link-freetext" href="http://moin.delph-in.net/PetInput"></a><a href="http://moin.delph-in.net/PetInput"><a href="http://moin.delph-in.net/PetInput">http://moin.delph-in.net/PetInput</a></a>.<br>
      <br>
      This was intentional since we are looking at the chart in detail,
      extracting "insights" from PET/ERG, and for this reason want (as
      much) mapping information from MRS to the chart (as practical).<br>
      <br>
      The from/to is helpful, but more direct linkage between elementary
      predications and the chart would be even better.<br>
      <br>
      Regards,<br>
      Paul<br>
      <br>
      P.S. We send FSC, too, and would appreciate advice or examples on
      how to constrain those with deeper semantics (as in the excellent
      discussion at <a moz-do-not-send="true" class="moz-txt-link-freetext" href="http://moin.delph-in.net/SuquamishMRSWordNet"></a><a href="http://moin.delph-in.net/SuquamishMRSWordNet"><a href="http://moin.delph-in.net/SuquamishMRSWordNet">http://moin.delph-in.net/SuquamishMRSWordNet</a></a>).)<br>
      <br>
      <br>
      On 03/29/2012 02:18 PM, Paul Haley wrote:
      <blockquote cite="mid:043101cd0dd8$5a6c81d0$0f458570$@com" type="cite">
        
        
        <style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
        <div class="WordSection1">
          <p class="MsoNormal">Greetings,<o:p></o:p></p>
          <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
          <p class="MsoNormal">I would appreciate any advice on how to
            get the cfrom/cto information output in the new MRS with the
            latest PET and ERG.<o:p></o:p></p>
          <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
          <p class="MsoNormal">Thank you,<o:p></o:p></p>
          <p class="MsoNormal">Paul<o:p></o:p></p>
          <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
          <p class="MsoNormal">Paul Haley<o:p></o:p></p>
          <p class="MsoNormal">Automata, Inc.<o:p></o:p></p>
          <p class="MsoNormal">(412) 716-6420<o:p></o:p></p>
          <p class="MsoNormal"><o:p>&nbsp;</o:p></p>
        </div>
      </blockquote>
    </blockquote>
  

</div></blockquote></div><div><span></span></div></body></html>