OmegaTの限界

genkaiにチャレンジ。

先日公開された、といっても相当経ちますが、USB3.0の仕様書をxdoc2txtでテキスト化したものを食わせてみました。サイズは980KBです。

20090214163019

私はOmegaT-1.8.1_2のWindows用バイナリを使っているので、JVMに渡すパラミターを指定されても困ってしまうだけです。

なんとなくインストールフォルダを眺めるとOmegaT.l4J.iniという如何にもな設定ファイルがあるので中をテケトーに書き換えてみました。

 

# OmegaT.exe runtime configuration
#
# To use a parameter, remove the ‘#’ before the ‘-‘

# Memory
-Xmx512M
# Language
#-Duser.language=en
# Country
#-Duser.country=GB
# Anti-aliasing (Java 1.4 and 1.5 only)
#-Dswing.aatext=true
# Entity expansion for XML (Java 1.4 only)
#-DentityExpansionLimit=400000

このファイルにはデフォルトで1024Mとコメントしてあります。1024MBも使う必要はないと思うのですが、Java書きの人はメモリの無駄遣い名人ですか?そもそも無指定時のデフォルト値はいくらなんですか?

 

さらに、ググるとデマを流す人・それを指摘しているような人。

OmegaT  Message RE [OmT] Not enough memory for java

・・・

>I’m using , for Windoze.
>
>OmegaT.exe -Xmx512M
In Windows (as of 1.7.3), one doesn’t use a script (OmegaT.exe doesn’t
accept parameters). Options are specified in OmegaT.l4J.ini.
Didier Briel

はっきりいってどちらが本当かよくわかりません。とにかくiniファイルでオプション指定したら、USB3.0の仕様書は読み込めたので。

20090214174130

 

次にグロッサリファイルとして辞書ファイルを放り込めば翻訳がバリバリ進むという噂を目にしたので、手持ちのEIJIROxx.TXTをGAWKで細工して放り込んでみたところ、

用語集読み込み中・・・

のままで数分間待たされます。文節移動ごとに発生するわけではないので、電子タバコのスイッチを入れる前に読み込ませれば良いのでしょう。

20090214172336

もしかしたらUltraSPARCあるいはNiagara搭載ハイパーワークステーションw/アルティメットSCSI-RAIDで作業している人たちなら、さくっと読み込めるのかもしれません。

#読み込み終わってもOmegaTの動作がモッサリしつづけてどうにもならないですな。だめだこりゃ。

やっぱりグロッサリはグロッサリで辞書ではないんですもんね。

 

最後にAWKワンライナーをメモしておきます。AWKなんて3年に1回しか使わないので、冗長かつぐちゃぐちゃです。

$ gawk ‘BEGIN { FS=":"; } { print "\"" $1"\"" "\t"  "\"" $2 "\""; }’ EIJIRO90a.TXT >EIJIRO90a.utf8

行頭の『■』はテキストエディタの置換機能で消しておきました。それがEIJIRO90.TXTです。CygwinでやるとシフトJISになるので、UTF8に変換するのをお忘れなく。

 

翻訳メモリの効果を得るには蓄積が必要なんでしょうが、このツールでは蓄積する気力が沸いてきません。世間のペレのみなさんはどんなツールをつこてはるんでしょうか。

 

りんくる:

クドーちゃ~ん(故・ナリタミキオの声で)

翻訳サービス、翻訳の仕事、フリーランス翻訳者