DTP駆け込み寺

No.20559へ返信

記事投稿フォーム
補助
送信

[ 返信 ]

Re: PDFからコピしたテキスト内の特定の文字が

PDFについては、目に見える文字的なものと、裏で持つ文字コードがイコールとは限りません。
アウトライン化されていれば当然テキストとしては取れませんし、テキスト的な情報を持っていても生成方法やアプリケーション次第では異なるカスタムコードになることはあります。
CID系フォントについてはPDF内にCIDtoUnicodeのテーブルを適切に持つことなども必要になってきます。

よってその点をまずは作成元やアプリケーション仕様と確認することが必要です。

[20559] あさうす (2021/06/14 Mon 11:58)