Nanonets-OCR-sは、画像をMarkdownへ高精度で変換するOCRモデルです。
このモデルはマークダウン形式で文書を出力し、セマンティックタグ付けを行います。
数式はLaTeX形式に、自動で変換されます。
ドキュメント内の画像は、<img>タグを使用して記述されます。
署名や透かしはそれぞれ個別のタグで識別されます。
複雑な表は正確に抽出され、MarkdownとHTML形式で出力されます。
Get notified when new stories are published for "🇯🇵 Hacker News 日本語"