DTP駆け込み寺

[ 返信 ]

Re: PDFからコピしたテキスト内の特定の文字が

PDFについては、目に見える文字的なものと、裏で持つ文字コードがイコールとは限りません。
アウトライン化されていれば当然テキストとしては取れませんし、テキスト的な情報を持っていても生成方法やアプリケーション次第では異なるカスタムコードになることはあります。
CID系フォントについてはPDF内にCIDtoUnicodeのテーブルを適切に持つことなども必要になってきます。

よってその点をまずは作成元やアプリケーション仕様と確認することが必要です。

[20559] あさうす (2021/06/14 Mon 11:58)


残り3件

  1. [20558] PDFからコピしたテキスト内の特定の文字がENスペースに化け ロクガツジュウイチロウ 2021/06/11 14:47
    1. [20559] Re: PDFからコピしたテキスト内の特定の文字が あさうす 2021/06/14 11:58
      1. [20561] Re^2: PDFからコピしたテキスト内の特定の文字が ロクガツジュウイチロウ 2021/06/15 12:52 *
    2. [20560] Re: PDFからコピしたテキスト内の特定の文字化け ショウブシ 2021/06/14 18:09
      1. [20562] Re^2: PDFからコピしたテキスト内の特定の文字化け ロクガツジュウイチロウ 2021/06/15 12:56