つい最近まで、インターネットは主にウェブページやデジタル文書の形でテキスト情報を作成・共有するために使用されていました。しかし、重要な情報の多くは依然として画像やスキャンされた資料として存在しています—たとえば、文書、契約書、請求書、書籍、マニュアル、サイン、手書きメモの写真などです。多くの場合、この情報は画像の中に閉じ込められており、特に外国語で書かれている場合、理解・検索・再利用が困難です。時間が限られている、またはコンテンツ量が多い場合、画像からテキスト情報を素早く抽出して翻訳する必要が強く求められます。手動で再入力したり詳細にレビューしたりすることなく、画像やスキャンのテキスト情報を迅速に抽出・翻訳できる AI アプリケーションは、時間を節約し、生産性を向上させ、アクセシビリティを大幅に高めます。
近年のディープラーニングとニューラルネットワークの急速な発展により、光学文字認識(OCR)や多言語テキスト翻訳といった高度なタスクが可能になりました。畳み込みとトランスフォーマーをベースとしたアーキテクチャに注意機構を組み合わせることで、最新のシステムは複雑なレイアウトの画像やスキャン文書からテキストを正確に検出・認識します。学習されたパターン、セマンティックな関係、単語の依存性を活用し、トランスフォーマーモデルは抽出されたテキストを高精度で翻訳し、意味、構造、文脈を言語間で保持します。
GroupDocs Translation が提供するこの無料のオンライン AI アプリケーションは、画像やスキャンファイルをテキストに変換し、ワンクリックで翻訳できます。アプリケーションは、ウェブサイトや YouTube などのオンライン動画サービスにホストされた画像ファイルを、コンピュータにダウンロードせずに翻訳できます。スマートフォンを含むあらゆるデバイスで利用可能です。