<div dir="ltr">Thanks a lot! I am now an ACE user.</div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jun 25, 2015 at 12:19 AM, Woodley Packard <span dir="ltr">&lt;<a href="mailto:sweaglesw@sweaglesw.org" target="_blank">sweaglesw@sweaglesw.org</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Petter,<br>
<br>
I notice &quot;format error: unknown type `+’.&quot; in the grammar loading log.  There’s nothing to say where that’s coming from, but in fact it refers to line 53 of rpp/lkb.rpp where a rule starts with &#39;+&#39; when ACE ungenerously believes it ought to start with &#39;!&#39;.<br>
<br>
The next problem I found is that lexemes have no TOKENS feature.  This feature is introduced on the type `word’ by a type addendum in tmt.tdl, but lexemes do not inherit from `word’.  With a token-aware workflow, the output of the token mapping phase is unified into the TOKENS feature of lexemes; when that feature is missing / not appropriate, it is an unexpected situation.<br>
<br>
Additionally, the token mapping rule &quot;generic_name_tmr&quot; is defaulting all tokens to [ +TRAIT: generic_trait ], which means they are incompatible with native lexical entries.  Since there are no POS tags, the generic lexical entries are also incompatible, so you get no lexemes and no parse.<br>
<br>
Finally, the tiny-lex.tdl lexicon has a start-of-string lexeme whose orthography is &quot;START&quot; rather than &quot;^&quot;, which makes it unable to match the &quot;^&quot; introduced by the REPP rules.<br>
<br>
I took the liberty of changing tmt.tdl to introduce TOKENS and the accompanying constraints on word-or-lexrule instead of word, commenting out generic_name_tmr, and rewriting START to ^ in tiny-lex.tdl.  With these changes I can parse &quot;Jon sover&quot; and get a plausible-looking MRS out.<br>
<br>
I hope that is helpful advice,<br>
-Woodley<br>
<div><div class="h5"><br>
&gt; On Jun 24, 2015, at 5:36 AM, Petter Haugereid &lt;<a href="mailto:petterha@gmail.com">petterha@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt; Hi,<br>
&gt;<br>
&gt; I am trying to load my Norwegian grammar into ACE, but I run into some issues when I try to parse a sentence.<br>
&gt;<br>
&gt; Loading the grammar seems to go fine (the config file is based on that of Jacy):<br>
&gt;<br>
&gt; petter@tor:~/tools/ace-0.9.21$ ./ace -G norsyg.dat -g ../../logon/petter/norsyg/ace/config.tdl<br>
&gt; reading configuration       from `../../logon/petter/norsyg/ace/config.tdl&#39;<br>
&gt; reading instance            from `../../logon/petter/norsyg/ace/../pet/qc.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../mtr.tdl&#39;<br>
&gt; grammar version             Norsyg (1206)<br>
&gt; format error: unknown type `+&#39;.<br>
&gt; reading grammar             from `../../logon/petter/norsyg/ace/../norwegian.tdl&#39;<br>
&gt; reading lexical-filtering-rulefrom `../../logon/petter/norsyg/ace/../lfr.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../matrix.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../nor.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../infl-codes.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../tmt.tdl&#39;<br>
&gt; reading types               from `../../logon/petter/norsyg/ace/../unknown.tdl&#39;<br>
&gt; reading lexical entries     from `../../logon/petter/norsyg/ace/../tiny-lex.tdl&#39;<br>
&gt; reading token-mapping-rule  from `../../logon/petter/norsyg/ace/../tmr/prelude.tdl&#39;<br>
&gt; reading token-mapping-rule  from `../../logon/petter/norsyg/ace/../tmr/pos.tdl&#39;<br>
&gt; reading token-mapping-rule  from `../../logon/petter/norsyg/ace/../tmr/pos-ipa.tdl&#39;<br>
&gt; reading token-mapping-rule  from `../../logon/petter/norsyg/ace/../tmr/finis.tdl&#39;<br>
&gt; reading generic-lex-entry   from `../../logon/petter/norsyg/ace/../gle.tdl&#39;<br>
&gt; reading rules               from `../../logon/petter/norsyg/ace/../rules.tdl&#39;<br>
&gt; reading lexical rules       from `../../logon/petter/norsyg/ace/../tiny-irules.tdl&#39;<br>
&gt; reading instance            from `../../logon/petter/norsyg/ace/../labels.tdl&#39;<br>
&gt; reading instance            from `../../logon/petter/norsyg/ace/../roots.tdl&#39;<br>
&gt; checking for glbs...        0.53 sec<br>
&gt; processing constraints...   0.67 sec<br>
&gt; processing rules            35 ms<br>
&gt; processing lex-rules        0 ms<br>
&gt; reading irregular forms     from ../irregs.tab<br>
&gt; processing lexicon...       1 ms<br>
&gt; simple lexemes              0 / 3 = 0.00%<br>
&gt; 3336 types (1501 glb), 3 lexemes, 77 rules, 1 orules, 983 instances, 722 strings, 234 features<br>
&gt; loading maxent model        0 ms<br>
&gt; reading tree labels         from `../../logon/petter/norsyg/ace/../labels.tdl&#39;<br>
&gt; loading tree-node-labels<br>
&gt; rule filter...              83.3% blocked (39.1% ss)<br>
&gt; rule filter...              83.3% blocked (39.0% ss)<br>
&gt; rule filter...              83.3% blocked (39.0% ss)<br>
&gt; rf-transitive closure...    1 ms<br>
&gt; loaded grammar in 2.41391s<br>
&gt;  types: 33.9M rules: 8.4M lex-info: 500<br>
&gt;  miscellaneous: 62K lex-dgs: 71K miscellaneous: 13.7M sem-index: 85K stochastic-model: 0 latmap rules: 18K<br>
&gt;  ... freezing 55.8M to file map 0x6000000000<br>
&gt;<br>
&gt;<br>
&gt; But when I try to parse the sentence &quot;Jon sover&quot;, I get an error message:<br>
&gt;<br>
&gt; petter@tor:~/tools/ace-0.9.21$ ./ace -g norsyg.dat -Tf1<br>
&gt; Jon sover<br>
&gt; ERROR: toklist or toklast missing on a token<br>
&gt; NOTE: lexemes do not span position 0 `^&#39;!<br>
&gt; NOTE: post reduction gap<br>
&gt; SKIP: Jon sover<br>
&gt; NOTE: ignoring `Jon sover&#39;<br>
&gt;<br>
&gt; It should be noted that I use REPP to add &quot;^ &quot; at the beginning of every input string, so the string the grammar attempts to parse is &quot;^ Jon sover&quot;. (&quot;^&quot; has a lexical entry.)<br>
&gt; I don&#39;t quite understand the meaning of the ERROR message. I have tried to find out if there are any TOKENS features that are missing in the grammar, but I don&#39;t know what is expected of the grammar. I am attaching a stripped down version of the grammar in case anyone would like to try to find out what goes wrong. (The config file is in ace/.)<br>
&gt;<br>
&gt; Best regards,<br>
&gt;<br>
&gt; Petter<br>
</div></div>&gt; &lt;norsyg_2015-06-24.tgz&gt;<br>
<br>
</blockquote></div><br></div>