2011年5月28日土曜日

Sente内の日本語PDFでテキスト選択ができない問題とその対応策


SenteはPDFに注釈を記入することが可能ですが、OCRされたものであれば文章を選択して選択箇所に直接コメントを書き込むことができたり(下図)、引用してコメントを残すことができます。論文の記述箇所と自分のコメントをリンクさせることができるので非常に便利な機能です。しかし、日本語論文の場合は文章を選択できない問題が起こることがしばしば。Senteに入っている論文をPreviewで開くと普通に選択できるのにSente上ではうまくいかないので、Senteの日本語の扱いが問題ですね。

Watson, J. D. & Crick, F. H. C. Molecular structure of nucleic acids. Nature 171, 737-738 (1953).

Senteのサポートフォーラムで同じ問題を質問している方がいましたので、僕の環境だけってことではなさそうです。
Sente Desktop: Compatibility Issue with Japanese PDFs
日本語というか、asian text?については互換性の問題があるみたいですね。着実にアップデートを重ねているSenteですから、しばらくすれば解消されると信じております。

さてさて、そんな状況なのですでに文字認識された論文についてはSenteのアップデートを待つしか無いのですが、これから日本語論文をOCRしてSenteに追加したいと思っている方へ(いるのかな?)、ちょっとした解決策をお教えします。それは、OCRにAdobeのAcrobat Proを使う、たったこれだけです。僕が今までにスキャンした日本語論文はすべてScanSnapに付属のソフトでOCRをかけていましたが、たまたまAcrobatで試したところなぜか問題なくSente上で文字選択が可能となりました。OCRの技術的な知識は皆無なので詳しくはわかりませんが、高いお金を出してAcrobatを買って良かったとしみじみ感じております。

文字認識されていない日本語論文がすでにSente内にある場合でも、一度別の場所にPDFを保存してAcrobatでOCR後にSenteに戻せばOKです。Sente側の問題が解消されるまではひとまずこの方法でしのごうと思います。

環境
Mac OS 10.6.7
Sente 6.2.11
Acrobat Pro 9.4.4

0 件のコメント:

コメントを投稿

LinkWithin

Related Posts Plugin for WordPress, Blogger...