Impulsat per groupdocs.com i groupdocs.cloud.
Tot i que fins fa poc Internet s'utilitzava principalment per crear i compartir dades textuals en forma de pàgines web i documents, la informació d'àudio i vídeo també juga un paper molt important en la nostra vida, ja sigui en forma de comunicació entre persones a Telegram o WhatsApp, o com a podcasts, fluxos, entrevistes, conferències, etc. I pot ser que aquesta informació sigui redundant o que el vostre temps sigui molt limitat, de manera que necessiteu captar ràpidament els punts clau de contingut multimèdia extens sense haver de consumir‑lo completament o simplement revisar conferències, reunions, entrevistes o podcasts de manera eficient.
El desenvolupament explosiu del Deep Learning i les xarxes neuronals en els últims anys ens ofereix la possibilitat de realitzar tasques tan complicades com el reconeixement de veu a text i la posterior resumició. Comb·inent arquitectures codificador‑decodificador i mecanismes d'atenció per mapar les característiques d'àudio a tokens de text, el transcriptor ofereix un resultat de reconeixement de text de qualitat superior, i l'arquitectura de transformador juntament amb el coneixement de patrons i dependències entre paraules permet entendre el significat del text i els seus punts clau per realitzar una resumició.
Aquesta aplicació gratuïta en línia d'IA impulsada per GroupDocs Translation pot transcriure els vostres fitxers d'àudio o vídeo a text i traduir‑los amb només un clic. L'aplicació pot traduir fitxers multimèdia allotjats en llocs web i serveis de vídeo en línia com YouTube sense descarregar‑los al vostre ordinador. Funciona en qualsevol dispositiu, inclosos els telèfons intel·ligents.