直到最近,互联网主要用于以网页和数字文档的形式创建和共享文本信息。然而,仍然有大量重要信息以图像和扫描材料的形式存在——例如文件、合同、发票、书籍、手册、标志和手写笔记的照片。在许多情况下,这些信息被锁定在图像中,导致难以理解、搜索或再利用,尤其是当内容是外语时。当时间有限或内容量庞大时,迫切需要快速提取并翻译图像中的文本信息,而无需手动重新输入或详细审阅。图像和扫描翻译 AI 应用可以节省时间,提高生产力,并大幅提升可访问性。
近几年深度学习和神经网络的快速发展使得光学字符识别(OCR)和多语言文本翻译等高度复杂的任务成为可能。通过将卷积和基于 transformer 的架构与注意力机制相结合,现代系统能够准确检测并识别图像和扫描文档中的文本,即使在复杂布局下也是如此。利用学习到的模式、语义关系和词语依赖,transformer 模型随后以高精度翻译提取的文本,保持跨语言的含义、结构和上下文。
这款由 GroupDocs Translation 提供支持的免费在线 AI 应用可将您的图像或扫描文件转录为文本,并只需一次点击即可进行翻译。该应用能够翻译托管在网站和 YouTube 等在线视频服务上的图像文件,而无需下载到电脑。它可在任何设备上使用,包括智能手机。