<div dir="ltr"><div>Thank you! Processing so much faster now :)<br><br><br></div>Megan<br></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, May 26, 2013 at 11:17 PM, Woodley Packard <span dir="ltr">&lt;<a href="mailto:sweaglesw@sweaglesw.org" target="_blank">sweaglesw@sweaglesw.org</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">You could `cat&#39; a file with one sentence per line into that same command, e.g.:<br>
<br>
$ cat test.txt<br>
&quot;Squeak!&quot; said the mouse.<br>
The dog said, &quot;Woof.&quot;<br>
$ cat test.txt | ./logon/bin/cheap -t -repp -preprocess-only=yy logon/lingo/erg/english<br>
[.....]<br>
(1, 0, 1, &lt;0:1&gt;, 1, &quot;“&quot;, 0, &quot;null&quot;)<br>
(2, 1, 2, &lt;1:7&gt;, 1, &quot;Squeak&quot;, 0, &quot;null&quot;)<br>
(3, 2, 3, &lt;7:8&gt;, 1, &quot;!&quot;, 0, &quot;null&quot;)<br>
(4, 3, 4, &lt;8:9&gt;, 1, &quot;”&quot;, 0, &quot;null&quot;)<br>
(5, 4, 5, &lt;10:14&gt;, 1, &quot;said&quot;, 0, &quot;null&quot;)<br>
(6, 5, 6, &lt;15:18&gt;, 1, &quot;the&quot;, 0, &quot;null&quot;)<br>
(7, 6, 7, &lt;19:24&gt;, 1, &quot;mouse&quot;, 0, &quot;null&quot;)<br>
(8, 7, 8, &lt;24:25&gt;, 1, &quot;.&quot;, 0, &quot;null&quot;)<br>
(9, 0, 1, &lt;0:3&gt;, 1, &quot;The&quot;, 0, &quot;null&quot;)<br>
(10, 1, 2, &lt;4:7&gt;, 1, &quot;dog&quot;, 0, &quot;null&quot;)<br>
(11, 2, 3, &lt;8:12&gt;, 1, &quot;said&quot;, 0, &quot;null&quot;)<br>
(12, 3, 4, &lt;12:13&gt;, 1, &quot;,&quot;, 0, &quot;null&quot;)<br>
(13, 4, 5, &lt;14:15&gt;, 1, &quot;“&quot;, 0, &quot;null&quot;)<br>
(14, 5, 6, &lt;15:19&gt;, 1, &quot;Woof&quot;, 0, &quot;null&quot;)<br>
(15, 6, 7, &lt;19:20&gt;, 1, &quot;.&quot;, 0, &quot;null&quot;)<br>
(16, 7, 8, &lt;20:21&gt;, 1, &quot;”&quot;, 0, &quot;null&quot;)<br>
<br>
I guess you can separate the sentences by seeing when the &quot;from&quot; vertex identifier resets to 0.<br>
<br>
For an entirely different approach, you could try the -Ev options with ACE.  The output contains the same data, but it is printed in a different format:<br>
<br>
$ cat test.txt | ~/cdev/ace/ace -g ~/cdev/ace/erg.dat -Ev 2&gt;/dev/null | grep -v &#39;^NOTE&#39;<br>
“&lt;0:1&gt; Squeak&lt;1:7&gt; !&lt;7:8&gt; ”&lt;8:9&gt; said&lt;10:14&gt; the&lt;15:18&gt; mouse&lt;19:24&gt; .&lt;24:25&gt;<br>
<br>
<br>
The&lt;0:3&gt; dog&lt;4:7&gt; said&lt;8:12&gt; ,&lt;12:13&gt; “&lt;14:15&gt; Woof&lt;15:19&gt; .&lt;19:20&gt; ”&lt;20:21&gt;<br>
<br>
<br>
Good luck,<br>
Woodley<br>
<div class="HOEnZb"><div class="h5"><br>
On May 26, 2013, at 11:04 PM, Megan Schneider wrote:<br>
<br>
&gt; Does anyone know of a good way to get bulk REPP tokenization for a set of sentences? The one-by-one method appears to be:<br>
&gt;<br>
&gt; echo &lt;sentence&gt; | ./logon/bin/cheap -t -repp -preprocess-only=yy ./logon/lingo/erg/english<br>
&gt;<br>
&gt; Is there a good way to do this without needing to reload the rules/types every sentence? Not looking for a functional difference, just an efficiency difference.<br>
&gt;<br>
&gt;<br>
&gt; Thanks!<br>
&gt; Megan<br>
<br>
</div></div></blockquote></div><br></div>