[developers] To do list

Dan Flickinger danf at csli.stanford.edu
Tue Jul 18 19:43:42 CEST 2006


Colleagues -

Using the current CVS version of the system, I did a batch run on the 'vei'
items, and then went through them one by one to see what was going right
or wrong.  Attached is an annotated listing of each item where the 
translation was missing or imperfect, with my diagnosis of what went wrong,
with the items grouped by component (Analysis, Transfer, and Generation).
My impression is that we could greatly improve our system performance if
we would attend to the few dozen error types identified in each of the
components.  I've made a few repairs already, and checked them in today,
so you should see improvements for those items that I've annotated as
"FIXED" (though occasionally there was more than one error per item).

While I encourage you to look at each of the items, there are a few 
repairs that would affect quite a large number of items, so it would be 
nice to get those first.  In particular:

1) Analysis: Sentence-initial proper names are often being misanalyzed
2) Transfer: Non sentence-initial proper names are being analyzed fine, 
   but the generator is unfortunately unable to accept guessed names where 
   the CARG value has an initial uppercase letter
3) Transfer: The auto-generated rules for nouns present a couple of problems:
   - when there are multiple senses, we often lose all but the first,
     since the last translation rule for the first sense is an _mtr rule
     rather than an _omtr one.
   - there is no obvious provision for mismatches in NUM or DIV, so
     e.g. the utstyr_equipment_0 rule wrongly says "equipment" is DIV -.
4) Generation: Rahking of outputs quite often wrongly prefers topicalized
   output, but it would seem there is enough training data to do this better.

Though I haven't checked this carefully yet, I'm confident that repairing
at least the more frequent error types seen in the 'vei' will give us a 
visible boost in performance on the more interesting, longer items in our
corpus.

Cheers,

 Dan

------------------------------------------------------------------------------
'vei' error diagnosis as of 17-Jul-06
------------------------------------------------------------------------------
Analysis
------------------------------------------------------------------------------
  Proper names not analyzed successfully:
-----------------------------------------
(10650) |Glitterheim|
(11500) |Sikkilsdalsseter|
(12110) |Juvasshytta|
(12240) |Hindsæter fjellstue|
(12360) |Maurvangen|
(13140) |MS Gjende|
(14540) |Nautgardstind|
(20560) |Eier: Fondsfinans AS.|
(20890) |Haugseter fjellstue|
(21120) |Jotunheimveien mellom Bygdin og Skåbu passerer hytta.| 
(21160) |Haugseter fjellstue har tatt imot turister siden 1860-tallet.|
(22240) |Bygdin Fjellhotell|
(30900) |Gravdalen ble innviet i 1975.|
(31950) |Sognefjellsveien går forbi hotellet.|
(32230) |Stølsdalen ble bygget i 1991 og drives som selvbetjeningshytte.|
(32550) |Sognefjellhytta|
(32690) |Tyinholmen høyfjellstuer|
(33580) |Utladalen naturhus|
(34740) |Kvitevatnet passeres på vestsiden.|
(35000) |Mjølkedalstind er et opplagt valg.|
(41630) |Nørdstedalseter|
(42670) |Bøvertun fjellstugu|
(42790) |Raubergstulen turisthytte|
(43010) |Elveseter hotell|
(44940) |Svellnosbreen og andre herligheter|

(150) |Fra veidemannsliv til turisme|
|-[0.49] # 0 {-16.92} --- error: unknown transfer predicates: |"_veidemann_n_rel"|.

(210) |Bjørne- og ulvestammen var tallrik og angrepslysten.|
- The 'and_rel' for "tallrik og angrepslysten" erroneously has an ARG1,
  which is bound to the ARG0 of "stammen".  That ARG0 should instead
  be bound to the ARG1 attribute for each of "bjørne" and "ulve".
  Similarly for
(11340) |Naturen rundt hytta er både voldsom og vennlig.|
(12600) |Den er noe luftig, men ufarlig.|
(23250) |Ruta til Gjendebu er ganske lett og fin.|

(530) |Mangfoldig flora og fauna|
- Shouldn't "flora" and "fauna" both be NUM pl rather than bare-singulars?

(660) |Variert planteliv gir grunnlag for et variert dyreliv.|
- Only produces two analyses, both topicalized.

(800) |Blant annet var Utladalen kjent for sin store bjørnestamme.|
|-[2.74] # 0 {-24.17} --- error: unknown transfer predicates: |"sit-involving_rel"|.

(10260) |Eier: DNT OA.|
- Event variable is [TENSE pres], but this is incompatible with ERG (untensed)
  Harmonize.

(10290) |Tlf: 61 23 89 10.|
- Only produces two analyses, both with guess_rel for "Tlf"

(10310) |Web: www.dntoa.no|
- Only produces two analyses, both with guess_rel for "Web"

(10440) |Hytta var og er populær, og turmulighetene er gode.|
- "var og er" loses the past tense from "var"

(10780) |Helt fra 1910 har familien Vole vært bestyrere på hytta.|
- No analysis

(11190) |DNTs eldste hytte|
- Analysis gives CARG as "DNTs" rather than desired "DNT"

(11280) |Det var DNTs tredje hytteprosjekt.|
- Third analysis assigns NUM pl to "prosjekt".

(11320) |Drøye 130 år senere har «stenrøisen» utviklet seg betydelig.|
- LBL of _sen_a_rel unbound in all three parses.  Also, the LBL of 
  _drøye_x_deg_rel should be identified with LBL of measure_of_rel,
  not with card_rel (or at least we should harmonize this).  

(11510) |Trivelig for hester og folk|
- Only analyses with verb "for" - no Adj-phrase fragment analysis

(11630) |Kombinasjonen jaktterreng og hestebeite gikk imidlertid dårlig.|
- No full analysis

(11780) |Sikkilsdalsseter har tatt imot turister siden 1868.|
- No analysis

(11920) |Besstrond Sæter har tatt imot turister siden 1976.|
- Only NP-fragment analyses

(12810) |Isteden renner nå vannet østover.|
- No full analysis

(12830) |Først forbi Bjørnbøltjørna og så etter hvert nedover mot Memurubu.|
- No full analysis

(12920) |Underveis passerer den først Sjugurtindtjørna og så Grunnevatnet.| 
- error: Ambiguous scoping relation: 3 not found in longest chain (38 39 97)..

(13080) |Dens 2368 meter gjør den til Norges 7. høyeste fjell.|
- Only analyses with "til" treated as possessive

(13320) |Den stopper både på Gjendebu, Memurubu og Gjendesheim.|
- ARG0 values of conj_rels are each missing a quantifier in NP coordination.
- Also for
(14860) |Den stopper både på Gjendebu, Memurubu og Gjendesheim.|

(14210) |Ruta er vardet videre fra sørkanten av fonna.|
- No analysis

(14310) |(For detaljer, se hefte nr. 4 i denne serien.)|
- No full analysis

(14610) |Glittertinds 2465 meter er uten tvil viktigste turmål fra Glitterheim.
- In the analysis of "Glittertinds 2465 meter" the LBLs of "card_rel" and
  "poss_rel" need to be identified with the LBL of "_meter_n_rel".

(20230) |Vinjestova, forløperen for Eidsbugarden hotell, ble åpnet i 1868.|
- No analysis

(20550) |Fondsbu turisthytte ble åpnet i 1993.|
- No full analysis

(20580) |Bestyrere: Nina Schreiber og Helge Lindstad.|
- Only two analyses both introduce 'title_id_rel' for "Nina Schreiber"

(20830) |Olavsbu selvbetjeningshytte ble innviet i 1952.|
- No full analysis

(21030) |Mange turister ble også fraktet inn i robåt.| 
--- error: unknown SEM-I predicates: |_robåt_n_rel|.

(21530) |Ny hytte, men gammel rute|
- No full analysis

(21580) |Som navnet antyder, var det beite for okser her inne.|
- No full analysis

(21940) |Følgende steder byr på overnatting på og rundt Beitostølen:|
- No full analysis

(22120) |Tyinholmen høyfjellstuer|
- No full analysis

(22260) |Riksvei 55 over Valdresflya passerer hotellet.|
- No full analysis

(22310) |Bygdin Fjellhotell ble innviet ca. 1900.|
- No full analysis

(22470) |Riksvei 51 over Valdresflya passerer hytta.| 
--- error: unknown SEM-I predicates: |_hytte_v_rel|.

(22510) |Valdresflya vandrerhjem ble innviet i 1952.|
- No full analysis

(22920) |- Kann du minnast Utsynet fraa Skineggen den morgonen du?|
--- error: unknown SEM-I predicates: |_gon_n_rel|.

(23070) |Bilvei og bussrute til Fondsbu, det samme forbi Bygdin Fjellhotell.|
- No full analysis

(23490) |Den T-merkede ruta fortsetter på sørsiden av Geithø mot Høystakktjernet.|
- All analyses treat "T-merkede" as unknown proper name (and capitalization
  leads to error, as noted elsewhere for guessed nouns).

(23590) |Bestigningen av Sjogholstind er også mulig for normalt fjellvante folk. --- error: unknown SEM-I predicates: |_fôre_v_rel|, |_fore_v_rel|.

(23680) |Turen starter langs sjøen og DNTs varder over mot Gjendebu.|
- No full analysis

(24080) |Bygdin på langs|
- No full analysis

(24220) |Det ligger ofte en snøfonn i skaret, så vær forsiktig.|
- No full analysis

(24300) |Den siste turen er omtrent en time kortere.|
- No analysis with measure_of_rel (needed for "en time kortere")

(24310) |De første fem-seks kilometerne er felles.|
- No full analysis

(24550) |Båtturen i seg selv er også en flott opplevelse.|
- No full analysis

(24640) |Fondsbu, Eidsbugarden, Torfinnsbu, Bygdin Fjellhotell og Valdresflya vandrerhjem (VH).| 
--- error: unknown SEM-I predicates: |_vandrerhjem_n_rel|.

(24700) |Villmarkstur i Leirungsdalen| 
--- error: unknown SEM-I predicates: |_villmark_n_rel|.

(30070) |Det var imidlertid lettere sagt enn gjort.|
- No full analysis

(30100) |Det viste seg så langtfra å være nok.| 
--- error: unknown SEM-I predicates: |langtfra_rel|.

(30200) |Det er merkede fotturruter til Turtagrø, Fannaråken, Sognefjellhytta, Krossbu, Leirvassbu.|
- No full analysis

(30360) |Det er dumt å vandre for raskt gjennom slik natur.|
- No full analysis

(30430) |Gården er på nærmere 50 000 mål.|
- No full analysis

(30630) |Fritt, fredelig og fraflyttet|
- No full analysis as AP-phrase

(30750) |Avdalen har også et selvbetjeningslosji som kan brukes hele året.|
- The index for "_Ã¥r_n_rel" is marked [DIV +], but shouldn't this be countable?

(30780) |Gravdalen ligger praktfullt til over skoggrensen.|
- Semantics not quite right: LBL of "_over_p_rel" is not identified with
  any other, and ARG0 of "_over_p_rel" is the ARG2 of "_til_p_rel"
  but should (presumably) be the ARG1 of "_til_p_rel".
- Similarly for
(35330) |Deretter ligger både Langeskavltind og Uraknatten lagelig til for besøk.|

(30800) |Synd bare at så få fotturister kjenner til denne perlen.| 
--- error: unknown SEM-I predicates: |_kjenne_n_rel|, |_kjenner_n_rel|, |_synde_v_rel|.

(31000) |Antagelig hadde det ikke vært slik virksomhet her før dette.|
- The neg_rel's ARG1 is QEQ nil

(31110) |Allerede den første vinteren blåste hytta ned.|
- Missing analysis where "hytta" is either ARG1 of inchoative "blåste",
  or ARG2 without "vinteren" as ARG1.

(31650) |Norges høyest beliggende turisthytte|
- No full analysis as NP

(31690) |Men av og til er toppen lokkende, lys og fager.|
- No analysis

(31930) |Turtagrø Klatrernes hotell|
- No full analysis as NP

(32000) |Turtagrø ble bygget i 1888.|
- Unfortunately, the first ten analyses all have _bygge_n_rel, so we don't
  get to see the first correct analysis at number 12.

(32360) |Krossbu turiststasjon startet opp i 1902.|
- No analysis as sentence, only as NP

(33320) |Men langtfra så mye som tidligere.| 
--- error: unknown SEM-I predicates: |langtfra_rel|.

(33610) |DNT og Statens naturoppsyn har egen informasjon i naturhuset.|
- No full analysis

(33750) |Gjennom årene har det vært til dels hard hogst.|
- Missing analysis with "_exist_v_rel" (see same sentence without "til dels")

(34170) |Det er daglig breføring fra primo juli til ultimo august.|
- EPs for "primo" and "ultimo" do not identify their LBL values with anything
  and leave their ARG1 values unbound.

(34250) |Se Tur 3a.|
- No full analysis

Føreren har med tau, brodder og nødvendig sikringsutstyr.|
- No full analysis

(40150) |I 1956 overtok døtrene Ragnhild og Tora roret.|
- No full analysis

(40370) |Det har da også skjedd med Spiterstulen.|
- No full analysis

(40440) |Heldigvis har denne veksten skjedd med vett.|
- The LBL of _heldigvis_a_rel is unbound.

(40750) |I dag minner det samme antallet steinvarder om tragedien.|

(41030) |Krossbu turiststasjon|
- No analysis as NP

(41130) |I 1914 sto derfor et anneks klart.|
- The outermost message identifies its MARG directly with the LBL of the
  subord_rel, but there should always be a QEQ linking the MARG with its 
  intended value, to make room for widest-scoping quantifiers (here outside
  the scope of the subord_rel).

(41180) |Breføring er fremdeles svært populært.|
- All three parses produce EP with predicate "sit-involving_rel".

(41450) |SÃ¥ sauen flyttet ut og turistene flyttet inn, bokstavelig talt.|
- No full analysis

(41640) |Sentralt i Breheimen|
- No analysis as AP phrase

(41720) |Mye har også skjedd i traktene rundt Nørdstedalseter.|
- The LBL of _også_a_rel is unbound.

(41970) |Binder sammen| 
--- error: unknown SEM-I predicates: |_sammen_p_rel|, |_binder_n_rel|.

(41990) |Medalsbu øverst i Middalen ble aldri noen suksess for DNT.|
- No full analysis

(42100) |Trulsbu har raskt blitt adskillig mer populær enn sin forgjenger.| 
--- error: unknown SEM-I predicates: |_sine_v_rel|.

(43070) |Stedet har tatt imot gjester fra ca. 1880.|
- Missing analysis of "1800" as yofc_rel

(43280) |Velg tur etter mavemål|
- Only get analyses with "_mage_n_rel"

(43330) |Forhåpentligvis har jeg lykkes.|
- Only an analysis with possessive of "_lykke_n_rel"

(43390) |Terrenget er så mangfoldig at meter og kilometer blir misvisende.|
- Only parses with cop_id_rel with ARG1 "Terrenget"

(43730) |Sprekker kan forekomme, så følg merkingen nøye.|
- No full analysis

(43780) |Knud O. Vole på Juvasshytta bygget det første.|
- All four analyses make a "guess_rel" for the "." after "Knud O"

(43840) |Vinteren 1970 tok vinden Volehytta.|
- No full analysis

(43860) |Byggherrer denne gang var Ragnhild og Tora Vole.|
- No full analysis

(44360) |Bretur på tvers| 
--- error: unknown SEM-I predicates: |_på+tvers_p_rel|, |_bre_v_rel|.

(44600) |Føreren har med tau, brodder og nødvendig sikringsutstyr.|
- No full analysis

(44870) |Etter å ha passert Ekrehytta fortsetter den ned i Helgedalen.|
- On analyses with nominalization of "_passe_v_rel", the ARG1 is bound,
  but I think should be left unbound for pragmatic control.  Consider 
  the NO equivalent of "Having lost, there was nothing to do."  where 
  there is no available binder for the ARG1.  Harmonize.

(44900) |Dessverre brant Turtagrø hotell i januar 2001.|
- Missing analysis with "Turtagrø hotell" as subject of intranstive "brant"

(44920) |Sjekk forholdene på forhånd med DNT eller direkte med hotellet.|
- On desired reading where "direkte" modifies "med", the LBL of _direkt_a_rel
  should be identified with that of _med_p_rel.

(45110) |Det siste er noe usikkert pr. mars 2001.|
- No analysis with yofc_rel for "2001"

(45180) |Området nordvest for Jotunheimen bærer navnet Breheimen.| 
--- error: unknown SEM-I predicates: |_bærer_n_rel|, |_nordvest_p_rel|, |_navne_v_rel|.

(45240) |Det er imidlertid mulig å gjøre etappen en del kortere.|
- No full analysis

(45260) |Den er fullt kjørbar og ikke stengt.|
- No full analysis

(45370) |Så går ruta oppover igjen og over nok en rygg.| 
--- error: unknown SEM-I predicates: |_nok_x_deg_rel|.

(45500) |Turen starter fra riksveien ca. 500 m sør for hytta.|
- The LBL of the measure_rel should be identified with the LBL of 
  _sør+for_p_rel which it rightly modifies, and not with the LBL of 
  _meter_n_rel.

(45810) |Turen over den 1800 meter høye breen er storslagen.|
- The LBL of the measure_of_rel should be identified with the LBL of
  _høy_a_rel, and its ARG1 should be the ARG0 of _høy_a_rel, and its
  ARG2 should be the ARG0 of _meter_n_rel.

(45910) |Etter Skålabotnskaret kommer du ned til den nedlagte Skålabotn seter.|
- No full analysis (missing NP for "den nedlagte Skålabotn seter")

(46050) |Dette er høydepunktet på turen, bokstavelig talt.|
- No full analysis

(50200) |Og ikke minst noe skikkelig å ha på føttene.|
- No full analysis

(50460) |Bukse eller nikkers i bomull (eller tilsvarende)| 
--- error: unknown SEM-I predicates: |_elle_v_rel|.

(50560) |Genser/jakke i ull eller fleece| 
--- error: unknown SEM-I predicates: |_fleece_n_rel|.

(50570) |Regntøy (om ikke vindtøyet også er egnet som regntøy)|
- No full analysis

(50580) |Reserve undertrøye, i ull eller annet materiale egnet for fjellbruk|
- No full analysis

(50590) |Lang underbukse, i ull eller annet materiale egnet for fjellbruk|
- No full analysis

(50780) |Nøkler (til hytta, hjemmet, bilen)|
- No analysis as NP

(50830) |På teltturer i sommerfjellet må du i tillegg ha med:| 
--- error: unknown SEM-I predicates: |_med_n_rel|.

(50860) |Kokesett og brennstoff| 
--- error: unknown SEM-I predicates: |_koke_n_rel|.

(51070) |Kartene bak i denne boka er i målestokk 1:100 000.|
- No full analysis

(51110) |Hele Norge dekkes av slike kart.|
- No full analysis

(51160) |Som regel går turen utmerket allikevel.|
- Missing analysis for "går utmerket" - only get subord_rel analysis

(51190) |Når uværet kommer, er det for sent.|
- No analysis

(51250) |Å ta ut en kurs|
- No analysis as VP

(51380) |Om ulykken er ute|
- No analysis as single phrase

(51520) |Store, livstruende blødninger må stanses så raskt som mulig.| 
--- error: unknown SEM-I predicates: |_stanse_n_rel|.

(51530) |Bruk trykkbandasje eller enkeltmannspakke.|
- No analysis

(51560) |Legg ham eventuelt med beina høyt.| 
--- error: unknown SEM-I predicates: |_med_n_rel|, |_bene_v_rel|, |_ham_n_rel|.

(51590) |Dekk åpne sår, helst med sterile kompresser.|
--- error: unknown SEM-I predicates: |_dekk_n_rel|, |_hilse_v_rel|.

(51660) |Fjellfolkets vanligste plage er lettere å forebygge enn å reparere.| 
--- error: unknown SEM-I predicates: |_fjellfolk_n_rel|, |_letter_n_rel|.

------------------------------------------------------------------------------
Transfer
------------------------------------------------------------------------------

(530) |Mangfoldig flora og fauna|
- kf.n.mtr includes rule unwanted translating "flora" to "guide to flora".

(670) |Selve karakterdyret er villreinen.|
- "karakterdyret" should get rule N+N => A+N for output "typical animal"

(760) |Der drives det også jakt på dette staselige dyret.|
- This s-passive needs to be marked PSV x to avoid fragment generation.
  Maybe should already be PSV-marked in analysis for such s-passives?
- Also for
(14020) |Her snakkes det helst om neste dags tur.|
(45360) |Bekken fra vannet må ofte vades.|
(51480) |En bevisstløs person skal legges i stabilt sideleie.|
- Also for the impersonal passive
(30380) |Det er bygget to små, men prektige selvbetjeningshytter på Vettismorki

(780) |Hjort og rådyr er så langt bare sett i Utladalen.|
- Transfer edge limit should maybe be higher, or order of rules maybe
  somehow constrained: the second (wrong) parses requires 1580 edges,
  since all rules are tried in all orders, and there's considerable
  lexical (transfer) ambiguity for this one.  With limit of 2000,
  get okay output for this one.

(870) |Det samme gjelder for øvrig flere falkearter.|
- "arter" translation should include "species"

(10220) |Merkede fotturruter til Bessheim, Glitterheim, Memurubu, Haugseter og Sikkilsdalsseter.|
- Transfer edge limit would have to be 6000 for this one, but maybe a more
  efficient solution could be found.

(10260) |Eier: DNT OA.|
- File kf.n.mtr has unfortunate rule ordering, with the following rule
  [eie_ownership_1 := noun_mtr & ...] ordered before some additional optional
  rules which thus never get invoked.
- Also, my native informant says kf.n.mtr rules for "_eie_n_rel" are dubious.

(10420) |De var riktige folk på rett plass.|
- "riktig" and "rett" should also get translation as "right"

(10450) |Her kan man komme seg på tur uansett vær.|
- The following two transfer rules are of the wrong type - there aren't
  degree-specifier entries in the SEM-I for these two.  Either we need
  a new rule type prep_adj+prep_mtr which treats these adjs as depictives
  (with subord_rel), or need to add these two as prepositions in ERG.

        uansett_p := prep_deg+prep_omtr &
        [ INPUT.RELS < [ PRED "_uansett_p_rel" ] >,
          OUTPUT.RELS < [ PRED "_regardless_a_of_rel" ],
                        [ PRED _of_p_rel ] > ].
        uansett_p := prep_deg+prep_mtr &
        [ INPUT.RELS < [ PRED "_uansett_p_rel" ] >,
          OUTPUT.RELS < [ PRED "_irrespective_a_of_rel" ],
                        [ PRED _of_p_rel ] > ].

(10690) |Med litt godvilje er det overnattingsplass for fire personer.|
|-[8.05] # 0 {-37.99} --- error: unknown transfer predicates: |"_vilje_n_rel"|.

(11210) |Helt nede fra Bøverdalen kom seterfolket.|
+ FIXED: Added degree_specifier_mtr for "hel" => "all+the+way"
- For other (here unintended) analyses, need new type of transfer rule for 
  degree-spec => scopal-adv, since "really" in ERG happens to be a scopal adv,
  not a degree spec.  The distinction is unfortunately necessarily blurry, 
  and hence not fully predictable, so the SEM-I must be consulted for target
  of each NorGram degree-spec.

(11320) |Drøye 130 år senere har «stenrøisen» utviklet seg betydelig.|
+ FIXED: Changed rule "measure" to match NorGram's pred name "measure_of_rel"

(11620) |Den dag i dag er det Sande-familien som driver Sikkilsdalssetra.|
|-[4.04] # 0 {-19.47} --- error: unknown transfer predicates: |"_den+dag+i+dag_rel"|.

(12720) |Der er det lagt ut bro.|
|-[2.03] # 0 {-15.33} --- error: unknown transfer predicates: |"_legge*ut_v_rel"|.

(12730) |Rundskuet fra Veslefjell er formidabelt.|
- "rundskuet" needs hand-built rule for target "panorama"

(12880) |Også denne turen er en klassiker.|
|-[2.81] # 1 {-16.01} --- error: unknown transfer predicates: "_også_x_deg_rel"
- Also
(35170) |For brevandrere er også utvalget stort.|
(44450) |Fotturen til Leirvassbu er også en flott opplevelse.|

(12930) |En varm sommerdag vil du nok sette pris på det.|
- Need idiomatic transfer rule for "sette pris på" => "appreciate"

(12980) |Vi fortsetter imidlertid langs stien til venstre og ned Bukkelægeret.|
|-[11.83] # 5 {-27.59} --- error: unknown transfer predicates: |"_til+venstre_rel"|.

(13290) |Offentlige kommunikasjoner|
- Should be "transportation" not (just) "communications"

(13440) |Den er ikke merket, men ruta gir seg selv.|
- Need idiomatic rule for "gir seg selv" => "is obvious"
- See also
(35110) |Det viktigste turmålet gir seg selv.|

(13460) |Han var god venn med den legendariske reinjegeren Jo Gjende.|
- "venn med" should be "a friend of" or "friends with", but not "a friend with"

(13530) |Fiske|
- Only translates as "fishery" but want "fishing"

(13590) |Fiskekort får du kjøpt på turisthyttene.|
|-[60.29] # 22 {-27.49} --- error: unknown transfer predicates: |"_få-perf_v_rel"|.

(13710) |De første menneskene kan forresten ha vært her temmelig tidlig.|
- "early" in ERG is semantically complex like "now", since it can be an NP,
  so need new transfer rule type to map ordinary adv to np-adv
- Also
(35210) |Tidligere var denne ruta kvistet.|

(13720) |Naturgrunnlaget var i hvert fall i orden.|
- ARG0 of "natur" is DIV - but in ERG this is incompatible with udef_rel
- Need more general solution to count-mass mismatches, presumably by 
  consulting ERG SEM-I.  For now, 
  FIXED (patched) individual patches in erg.mtr ...
  See also
(30780) |Gravdalen ligger praktfullt til over skoggrensen.
(34760) |Turen krever brekunnskap.|
(50010) |På is og snø|
(50420) |PÃ¥kledning:|
(50470) |Ullsokker|
- Conversely, a rule like the following in lexicon.mtr will never fire,
  since the input is DIV + but the output must be DIV -, so lose example below
        overnatting_n := n_adj+n_mtr &
        [ INPUT.RELS < [ PRED "_overnatting_n_rel" ] >,
          OUTPUT.RELS < [ PRED "_overnight_a_1_rel" ],
                        [ PRED "_tour_n_of_rel" ] > ].
(50380) |Utstyrsliste for sommerturer med overnatting i hytter|
- And "truse", "bukse" are NUM sg, but the translations must all be NUM pl
(50430) |Truse|
(50530) |Vindbukse|
(50630) |Kort bukse|

(14010) |Det merkes på den hyggelige praten i peisestua om kvelden.|
- "det merkes" should maybe have special rule for "that is noticeable"?
+ FIXED: n_nominalization+n_mtr was archaically producing adj_n output, so
  peisestue could not get output as "fireplace living room".

(14030) |For svært mange dreier det seg da om Glittertind.|
|-[2.03] # 0 {-21.35} --- error: unknown transfer predicates: |"_dreie*om_refl_v_rel"|.

(14040) |Norges nest høyeste topp er et flott turmål.|
+ FIXED: 'generic_nonpro' rule also has to add card_rel.

(14060) |Er det fint vær, bør du absolutt gjøre det.|
- "absolutt" should also translate as scopal "absolutely" and "certainly"

(14380) |Glem allikevel ikke å løfte blikket av og til.|
- ERG doesn't allow "still don't ..." imperative with intersective
  "still", so would have to convert "still" to scopal here.

(14430) |Semmelåa vades eller steingås.|
|-[0.98] # 0 {-7.40} --- error: unknown transfer predicates: |"_steingå_v_rel"|
- Also
(22740) |Elva Vøloa kan normalt steingås.|
(34530) |Bekken fra Nedre Høgvagltjønn steingås, eller vades.|
(45930) |Elva i dalbunnen kan vanligvis også steingås.|

(20460) |Også den toppen krever brevandring.|
|-[6.69] # 0 {0.00} --- error: unknown transfer predicates: "_også_x_deg_rel".

(20640) |Selvbetjent smørøye|
|-[0.95] # 0 {0.00} --- error: unknown transfer predicates: |"_selvbetjent_a_rel"|.

(20710) |I ryggen har Olavsbu den langstrakte Raudalseggi på 2168 meter.|
- Guesser leaves "Raudalseggi" as capitalized because it's not S-initial, 
  but CARG must be all lower case for LKB generator (for some reason).
- Similarly for
(31450) |Den nye Leirvassbu sto klar i 1906.|
(31840) |Det er merkede fotturruter til Turtagrø, Sognefjellet og Skogadalsbøen
(31960) |Det er merkede fotturruter til Fannaråken, Skagastølsbu og Stølsdalen.
(32720) |Merkede fotturruter til Skogadalsbøen, Vettismorki og Slettningsbu.|

(20950) |Det ble også tidlig populært å ha seter ved Vinstri.|
+ FIXED: Constrained INPUT ARG0 to be untensed, to avoid translating "ble" as
  future:
        inchoative_asp_nf := monotonic_mtr &
        [ INPUT.RELS < [ ARG0 #e & e & [ TENSE untensed ] ],
                       [ PRED "inchoative_asp_rel", ARG1 #e ] >,
          OUTPUT.RELS < +copy+ & [ ARG0 #e & [ TENSE fut ] ] >,
          FLAGS.EQUAL < #e > ].

(21070) |I 1989 brant dessverre Haugseter fjellstue ned til grunnen.|
|-[2.09] # 2 {-28.31} --- error: unknown transfer predicates: |"_brenne*ned_v_caus_rel"|.

(21090) |Det burde glede både fotturister og veifarende langs Jotunheimveien.|
+ FIXED: erg.mtr was still making modals be MODD ind_or_mod_subj; and now
  map "ought" and "should" from TENSE past to TENSE pres.

(21220) |Hytta som flyttet på seg|
|-[0.54] # 0 {0.00} --- error: unknown transfer predicates: |"_flytte*på_refl_v_rel"|.

(21340) |Fjellklatrerne viste tidlig interesse for Torfinnsbu og gjør det fortsatt.|
- Need rule to allow translation of "gjør det" as just "do" (without "it").

(21350) |Spesielt gjør Torfinnstindane et imponerende inntrykk nedenfra Bygdin.||-[2.03] # 0 {-29.97} --- error: unknown transfer predicates: |"_imponere_v_rel"|.
- Also
(24560) |Spesielt Torfinnstindane gjør et imponerende inntrykk nede fra Bygdin.

(21630) |Men med nye tider kom nye behov.|
- Need rule to convert 

(21630) |Men med nye tider kom nye behov.|
+ FIXED: Added new rule type for "but" which is NG disc_adv, but ERG conj

(21670) |Seterlosjiene ble lagt ned og rutene grodde igjen.|
|-[2.03] # 0 {-20.35} --- error: unknown transfer predicates: |"_legge*ned_v_rel"|.

(22190) |Tyinholmen høyfjellstuer har tatt imot turister siden 1893.|
- Need rule for "ta imot" => "take in" as in "welcome"


(22620) |Ruta er nymerket og går til Bygdin hotell.|
|-[2.03] # 0 {-28.25} --- error: unknown transfer predicates: |"_nymerket_a_rel"|.

(22710) |Heldigvis er det gode siktevarder langs ruta.|
+ FIXED: Generalized rule for s-initial scopal "besides" to also be usable for
  "luckily".  Moved ERG fix-up rule type to mtr.tdl, pending better organizing

(23150) |Den første halve kilometeren går ruta på grusvei.|
- Need additional rule for "gå" which produces "go" rather than "walk" here.

(23300) |Det forteller sitt om de gode vekstvilkårene rundt Gjende.|
|-[58.72] # 8 {-33.95} --- error: unknown transfer predicates: |"_fortelle*om_v_rel"|.

(23310) |Særlig på forsommeren er fargeprakten stor.|
|-[2.03] # 0 {-13.99} --- error: unknown transfer predicates: |"_forsommer_n_rel"|.

(23480) |Den er ganske bratt på slutten ned mot Fondsbu.|
+ FIXED - Rule n_nominalization_mtr said nothing about DIV on OUTPUTs' 
  nominalization_rel, so was erroneously defaulted to DIV -.  But can't
  just stamp [DIV +] on, since many nouns (like "fottur") are correctly
  [DIV -].  So add erg-specific rule that stamps [DIV +] on ARG0 of
  nominalization_rel.

(23610) |Skardalstind er også en nydelig topp.|
|-[17.10] # 0 {-19.85} --- error: unknown transfer predicates: "_også_x_deg_rel".

(23810) |En favoritt hos mange er turen på Gjendestunga.|
- "hos mange" should (also) be translated as "of many" not just "by many"

(23850) |Følg ruta mot Torfinnsbu opp i Svartdalen.|
+ FIXED - With the addition of the VPM machinery, the files noen/in.vpm and
  noen/out.vpm had neglected to preserve the feature DITCH, so fixup rules
  like intransitive_preposition_ef weren't working.
- See also
(23880) |Ryggen følges oppover, over en fonn, og videre til toppvarden.|
(34570) |Oppe på Raudalsbandet åpner utsynet seg igjen.|

(24080) |Bygdin på langs|
|-[0.43] # 0 {0.00} --- error: unknown transfer predicates: |"_på+langs_a_rel"|
- Also
(33050) |Utladalen på langs|

(24300) |Den siste turen er omtrent en time kortere.|
+ FIXED: --- error: invalid predicates: |"_about_x_approx_rel"|.

(24440) |Navnet har den fått etter sin langstrakte, bøyde form.|
|-[12.49] # 0 {-29.63} --- error: unknown transfer predicates: |"_bøye_v_rel"|.

(24500) |Tyin fikk først motorbåt i 1906.|
+ FIXED - Missing rule for simple transitive "get"

(24530) |Hele sommeren går den fram og tilbake på innsjøen.|
+ FIXED - NorGram makes season_rels [DIV +], but they are [DIV -] in ERG.
- Also
(35230) |Her går det fører hele sommeren.|

(30370) |Det trenger du da heller ikke.|
+ FIXED - Changed rule for "heller" from "rather" to "actually"

(30380) |Det er bygget to små, men prektige selvbetjeningshytter på Vettismorki
*** FIX - The following rule erroneously applies to the "but_rel" as the INPUT
    even though it has no ARG1 attribute.  Patched to restrict this rule to
    PRED value "_nesten_x_deg_rel" in both INPUT and OUTPUT.
        deg+card_nf := monotonic_mtr &
        [ CONTEXT [ RELS < [ LBL #h0, ARG0 #x1 & x, RSTR #h2 ],
                           [ PRED "card_rel", LBL #h3, ARG0 #e4 & e, ARG1 #x1 ],
                           [ LBL #h3, ARG0 #x1 ] >,
                    HCONS < qeq & [ HARG #h2, LARG #h3 ] > ],
          INPUT.RELS < [ PRED #pred, LBL #h3, ARG0 #e5, ARG1 #e4 ] >,
          OUTPUT.RELS < [ PRED #pred, LBL #h0, ARG0 #e5, ARG1 u ] >,
          FLAGS.EQUAL < #x1, #e4 > ].

(30730) |Oppe på Avdalen gård er det derimot liv og virksomhet.|
|-[26.96] # 0 {-22.65} --- error: unknown transfer predicates: "_oppe_rel".

(30910) |Årdal Turlag driver den ubetjente hytta.|
|-[2.03] # 0 {-16.54} --- error: unknown transfer predicates: |"_ubetjent_a_rel"|.
- Also
(31260) |Hytta er ubetjent.|
(31300) |DNT leier to sel og driver dem som ubetjent hytte.|

(31010) |Stølen var i bruk til 1940.|
- Surprisingly, kf.n.mtr contains no mention of "_støl_n"

(31680) |En taus advarsel om storm og uvær.|
- Need translation of "uvær" as "bad weather"

(31730) |Oversikten over Smørstabbreen i øst er nesten total.|
- Want to translate "i øst" as "in the east" not "in an east" (same for other
  compass directions, of course).

(33600) |Utstillingen forteller om naturforhold og kulturhistorie i Vest-Jotunheimen.
|-[2.11] # 0 {-32.18} --- error: unknown transfer predicates: |"_fortelle*om_v_rel"|.

(33810) |Fluorgass fra Årdal har imidlertid skadet skogen sterkt.|
- Want "severely" as another translation of "sterkt".

(34150) |Rutene møtes før Prestesteinsvatnet og går sammen til breen.|
- Want translation of "møtes" as intransitive "routes meet", not passive.
- Also
(44730) |Rutene møtes før Prestesteinsvatnet og går sammen til breen.|

(40020) |Naboen til Galdhøpiggen|
- Also want "neighbor of" along with "neighbor to"

(40490) |Beliggenheten er unik på andre måter også.|
- Also want "in other ways", not only the undesirable "on other ways"

(40710) |Sommerskiløping og breturer|
|-[0.95] # 4 {-11.29} --- error: unknown transfer predicates: |"_skiløping_n_rel"|.

(40750) |I dag minner det samme antallet steinvarder om tragedien.|
+ FIXED: Added rule type for "minne+om" from arg123 to arg12+pp ("commemorate")

(41040) |Fra skysstasjon til bresenter|
|-[0.74] # 3 {-17.15} --- error: unknown transfer predicates: |"_skyss-stasjon_n_rel"|.

(41100) |Det var Nils T. Bakkeberg som var mester for byggverket.|
- Unfortunate ordering of rules in kf.n.mtr for the following two pairs,
  where in each case a change of word sense ends up with a non-optional
  rule blocking access to the other sense:
        bygg_barley_0 := noun_mtr &
        [ INPUT.RELS < [ PRED "_bygg_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_barley_n_1_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "1", AUTHOR "oe", DATE "31-5-2006" ] ].
        bygg_construction_0 := noun_omtr &
        [ INPUT.RELS < [ PRED "_bygg_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_construction_n_of_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "4", AUTHOR "oe", DATE "31-5-2006" ] ].

        verk_pus_4 := noun_mtr &
        [ INPUT.RELS < [ PRED "_verk_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_pus_n_1_rel" ], ... >,
          FLAGS [ RANK "4", COUNT "5", AUTHOR "oe", DATE "31-5-2006" ] ].
        verk_work_0 := noun_omtr &
        [ INPUT.RELS < [ PRED "_verk_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_work_n_1_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "15", AUTHOR "oe", DATE "31-5-2006" ] ].
- See also loss of translation as "game" 
(51040) |Det finnes gjerne både spill og barnebøker til utlån.|
        spill_winch_0 := noun_mtr &
        [ INPUT.RELS < [ PRED "_spill_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_winch_n_1_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "1", AUTHOR "oe", DATE "31-5-2006" ] ].
        spill_game_0 := noun_omtr &
        [ INPUT.RELS < [ PRED "_spill_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_game_n_1_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "9", AUTHOR "oe", DATE "31-5-2006" ] ].

(41200) |I sesongen går det gjerne fører begge veier, hver dag.|
- File kf.n.mtr surprisingly makes no mention of "sesong"
- Also
(50040) |I sommersesongen går det førere over enkelte breer i Jotunheimen.|

(41660) |Norges lengste fjord heter Sognefjorden.|
+ FIXED: Rule "hete_v" had typo in output's ARG3, but also failed to make the
  containing message be marked for PSV, which is necessary ERG "is named".

(42140) |Særlig Tussetind er flott.|
- Want "particularly" as event modifier, not only "particular" modifying Ttind

(42150) |Den er oppkalt etter fjellklatrepioneren Therese Berteau.|
|-[2.30] # 0 {-26.42} --- error: unknown transfer predicates: |"_oppkalle*etter_v_rel"|.

(43380) |Men slik er det altså i norske fjell.|
|-[2.84] # 0 {-20.91} --- error: unknown transfer predicates: "_slik_a_rel".

(43440) |Rutebeskrivelsene blir mye mer interessante på den måten.|
- Want "in that way", not just "on" or "at"

(43490) |Turenes vanskelighetsgrad|
- kf.nn.mtr should include "vanskelighetsgrad" => "degree of difficulty"

(43660) |Returen er så ned den vanlige ruta til Spiterstulen.|
- Also want "så" => "then" not just "so"

(45620) |Det arrangeres guidede turer til grottene.|
|-[2.02] # 0 {-21.34} --- error: unknown transfer predicates: |"_guide_v_rel"|.

(45960) |Heldigvis skjer dette svært sjelden i sommersesongen|
|-[0.69] # 0 {-23.23} --- error: unknown transfer predicates: |"_sjelden_a_rel"|, |"_sesong_n_rel"|.

(46090) |Merkingen passerer en knapp kilometer vest for toppen av Liabreen.|
|-[30.27] # 0 {-28.59} --- error: unknown transfer predicates: |"_merking_n_rel"|.

(50010) |På is og snø|
- Duplicate rules in lexicon.mtr and kf.n.mtr:
        is_n := noun_mtr &
        [ INPUT.RELS < [ PRED "_is_n_rel" ] >,
          OUTPUT.RELS < [ PRED "_ice_n_1_rel" ] > ].
        is_ice_0 := noun_omtr &
        [ INPUT.RELS < [ PRED "_is_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_ice_n_1_rel" ], ... >,
          FLAGS [ RANK "0", COUNT "4", AUTHOR "oe", DATE "31-5-2006" ] ].

(50020) |Breføring|
+ FIXED error in "føring_n" rule, which had neglected to bind ARG0 of message

(50210) |Godt fottøy er halve turen.|
- Want translation of "fottøy" as "footwear", not just "foot material"

(50380) |Utstyrsliste for sommerturer med overnatting i hytter|
- Add translation of "overnatting" as "overnight stay" (only "tour" so far)

(50430) |Truse|
- Following rule from kf.n.mtr should be "_briefs_n_1_rel" (oblig plural noun)
        truse_briefs_4 := noun_mtr &
        [ INPUT.RELS < [ PRED "_truse_n_rel" ], ... >,
          OUTPUT.RELS < [ PRED "_brief_n_1_rel" ], ... >,
          FLAGS [ RANK "4", COUNT "5", AUTHOR "oe", DATE "31-5-2006" ] ].

(50670) |Kartmappe, gjerne med blyant og papir| ---
|-[0.95] # 3 {-19.23} --- error: unknown transfer predicates: |"_blyant_n_rel"|.
(50730) |Støvelimpregnering|
|-[0.39] # 0 {-6.44} --- error: unknown transfer predicates: |"_impregnering_n_rel"|.

[23:16:09] (50760) |Reserveproviant (f.eks. sjokolade)|
|-[3.36] # 0 {-7.17} --- error: unknown transfer predicates: "_for+eksempel_a_rel".

(50810) |En slik utrustning i en normal ryggsekk veier 7-10 kg.|
|-[4.28] # 0 {-40.28} --- error: unknown transfer predicates: |"cardinterval_rel"|.

(50850) |Liggeunderlag|
- Need translation as "ground pad"

(50870) |Tallerken og bestikk|
- Need translation of "bestikk" as "cutlery", not (just) "case"

(50910) |Ta med barna til fjells|
|-[0.72] # 0 {-11.42} --- error: unknown transfer predicates: |"_ta*med_v_rel"|.
(50920) |Det er fint å ha med barna til fjells.|
|-[2.83] # 0 {-23.31} --- error: unknown transfer predicates: |"_til+fjells_rel"|.

------------------------------------------------------------------------------
Generation
------------------------------------------------------------------------------

(10220) |Merkede fotturruter til Bessheim, Glitterheim, Memurubu, Haugseter og Sikkilsdalsseter.
+ FIXED: ERG NP fragments did not constrain message's ARG0 to be an event.
- Transfer edge limit still hit for this one.

(10360) |De vandret gjennom skaret og ned mot Øvre Sjodalsvatn.|
- The proper noun "Øvre Sjodalsvatn" is NUM pl in Norgram, but sg in ERG.
  How to automatically acquire these proper name NUM assignments from Norgram?

(11280) |Det var DNTs tredje hytteprosjekt.|
- Why are topicalized variants ranked higher for this one?

(11430) |Gjendebu ble innviet i 1871.|
- Why are fragments ranked higher than full analyses here?

(13350) |Det er en rekke fristende dagsturmål rundt Gjendesheim.|
- Why is topicalization ranked above there-copula outputs?

(13400) |Sør for Gjende er det også mange valgmuligheter.|
- It+identity ranked higher than there-copula.

(13610) |Den store rundturen|
- Ranking "smooth trip" above "round trip"

(13790) |Den merkede ruta fortsetter slakt utover mot Russvatnet.|
- ERG currently does not allow "_a_" predicates to modify "_p" predicates,
  so direct translation of "slakt utover" as "gradually across" won't 
  generate like "directly across".  Harmonize.

(13890) |Ruta til høyre går gjennom det trolske og storslagne Tjørnholet.|
+ FIXED: ERG failed to allow "the enchanting and magnificent Tjørnholet".

(14040) |Norges nest høyeste topp er et flott turmål.|
+ FIXED: 'next highest' was getting the wrong semantics.

(14400) |Den største er store Hellstugutind på 2345 meter.|
- Ranking: topicalized highest

(14840) |Bussruter til Gjendesheim, Bessheim og Spiterstulen.|
+ FIXED: Comma punctuation did not like the "/" which the unknown word
  guesser supplies in the orthography, and multiple coord requires comma
  on penultimate conjunct.

(20570) |DNT OA leier hytta.|
- Ranking: topicalized highest

(21630) |Men med nye tider kom nye behov.|
+ FIXED: Corrected mrsglobals.lsp assignment of *non_expl-ind-type*

(23540) |Stopp gjerne over en dag eller tre på Olavsbu.|
+ FIXED: Error in ERG for partitive numbers, preventing coord - now fixed.

(30240) |Skogadalsbøen ble innviet i 1888.|
- Ranking: fragment highest

(30580) |Hyttene eies og drives av Vetti gård som selvbetjeningshytter.|
- Ranking

(31070) |På Skagastølsbu er det ikke mye idyll.|
 - ERG can't match the analysis given by NorGram ("not often"). Harmonize.

(31200) |Det er ikke merkede ruter til Skagastølsbu.|
- Ranking: expletive last

(31210) |Stølsmaradalen har merkede ruter til Avdalen og Vetti.|
- Ranking: best one last

(31290) |Stølsmaradalen ble innviet i 1975.|
- Ranking: Fragment highest

(33620) |Om sommeren er det kafé i våningshuset.|
- Ranking: expletive near last

(34050) |Bussruter både til Øvre Årdal og til Turtagrø og Sognefjellet.|
- Ranking: "bus rounds" higher than "bus routes"

(35030) |Den andre toppen jeg vil fremheve, er Austre Raudalstind.|
- Ranking: topicalized highest

(35040) |Den bestiges lettest fra nordsiden.|
- Added fix-up rule to convert n+n "nordsiden" to adj+n, to match ERG.
- Also
(44670) |Nedgangen på vestsiden er vanligvis på nordsiden av Bøverbreen.|

(40350) |Den største turisthytta|
- Ranking: "most large" higher than "largest"

(40890) |Det går daglig fører over Fannaråkbreen og Smørstabbreen.|
- Ranking: topicalized highest

(42330) |Hytta ble åpnet i 1946.|
- Ranking: fragment highest

(43440) |Rutebeskrivelsene blir mye mer interessante på den måten.|
- Ranking: topicalized highest

(43540) |Til topps på Galdhøpiggen fra Spiterstulen|
- ERG cannot match the reasonable NorGram analysis where both "to" and "from"
  modify the unknown_rel (on non-sentence analysis).  May need fix-up rule.
- Also
(43980) |Til topps på Galdhøpiggen fra Juvasshytta|

(44160) |PÃ¥ toppen er det en liten kafeteria.|
- Ranking: want expletive "there" highest

(50160) |Utstyr for fotturer|
- Ranking: don't want countable "a gear"

(50210) |Godt fottøy er halve turen.|
+ FIXED error in lexical entry for "foot" prevented compound "foot material"
------------------------------------------------------------------------------



More information about the developers mailing list