アカウント名:
パスワード:
「止」と「用」と「行」だけフォントが違うようなんだけどどうして?
フォントが違うというか、CJK部首補助(U+2F00~)を使っているようですね。OCRでキャプチャして目視チェックでネットにペタリ、ってところでしょうか。ふぉんとにもう。
OCR ではなく、 PDF からのコピペですね。(リンク先にPDFが掲載されています)PDFのタイトルからすると、 Word 文書から作成されたPDFのようです。
自分の環境でも、Wordで普通の字を使ったはずなのに、PDFにしたら、同じ見た目の違う文字コードの字になっていたことがあって、理由(回避方法)があるなら知りたい。
(1) 「フォントを埋め込まずビットマップに変換」的なオプションでPDFに保存(2) ビューアにより「ビットマップを文字コードに変換」的なオプションでOCR処理(3) Unicode順で単純な漢字よりも部首が優先される。たとえば 人(U+4EBA) が ⼈(U+2F08) に。
ここで言うOCRはいわゆるデジタル文字認識です。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
ところで (スコア:0)
「止」と「用」と「行」だけフォントが違うようなんだけどどうして?
Re: (スコア:0)
フォントが違うというか、CJK部首補助(U+2F00~)を使っているようですね。
OCRでキャプチャして目視チェックでネットにペタリ、ってところでしょうか。
ふぉんとにもう。
Re:ところで (スコア:2)
OCR ではなく、 PDF からのコピペですね。(リンク先にPDFが掲載されています)
PDFのタイトルからすると、 Word 文書から作成されたPDFのようです。
自分の環境でも、Wordで普通の字を使ったはずなのに、PDFにしたら、同じ見た目の違う文字コードの字になっていたことがあって、理由(回避方法)があるなら知りたい。
svn-init() {
svnadmin create .svnrepo
svn checkout file://$PWD/.svnrepo .
}
Re:ところで (スコア:1)
(1) 「フォントを埋め込まずビットマップに変換」的なオプションでPDFに保存
(2) ビューアにより「ビットマップを文字コードに変換」的なオプションでOCR処理
(3) Unicode順で単純な漢字よりも部首が優先される。たとえば 人(U+4EBA) が ⼈(U+2F08) に。
ここで言うOCRはいわゆるデジタル文字認識です。