miércoles, 16 de noviembre de 2022

Extraer el texto de un archivo de Scribus

En mi trabajo me pidieron que exportara a archivos de Microsoft Word todo el texto contenido dentro de unos archivos de Scribus que yo había diseñado, porque querían enviar los archivos de texto resultantes a traducir a otros idiomas para luego hacer nuevas versiones de esos archivos de Scribus con los textos traducidos.

Por lo visto, Scribus no tiene una opción nativa para exportar a Microsoft Word.

Lo primero que probé fue abrir desde Libre Office Draw los PDFs generados desde Scribus y el resultado, visualmente, fue muy bueno, pero generaba un marco de texto por cada línea de texto. Lo que no lo hacía apto para la tarea del traductor.

Entonces, hasta donde yo sé, la opción que me quedaba era seleccionar los textos en el archivo de Scribus, copiarlos y pegarlos en un documento de Libre Office Writer, para luego guardarlos con el formato de Microsoft Word.
Pero el diseño tenía varias cajas y yo prefería obtener todos los textos de un solo paso.

Hice una búsqueda y di con este script: https://wiki.scribus.net/canvas/Extracting_All_Text_from_a_Document.

Lo probé con ciertas dudas, porque es un script de 2008.

En Scribus 1.5.8 (la versión más reciente) no funcionó. Pero tampoco me ha funcionado el script Scribus Generator, que utilizo bastante y cuya última actualización es de febrero de este año.

Supuse que el tema estaría vinculado con alguna actualización de Python en Scribus. Así que descargué la versión anterior de Scribus (la 1.5.7), pero daba el mismo error. Lo mismo con la versión 1.5.6.
Con la versión 1.5.5 sí funcionó.

Luego, leyendo las notas de lanzamiento de la versión 1.5.6 se ve, en el apartado Scripter, que dice algo así: ...Scribus ahora utiliza Python 3 de forma predefinida. Como consecuencia, los scripts existentes probablemente necesitarán ser modificados para que se ejecuten correctamente en Scribus 1.5.6... 

Quizás sea muy sencillo modificar el script pero, como mis conocimientos sobre Python son nulos, se me hace una tarea imposible. Así que, de momento, usaré la versión 1.5.5 cuando se trate de correr estos scripts.

Entonces, ejecuté el script desde Scribus 1.5.5 y obtuve un archivo en formato TXT  con el contenido de todas las cajas de texto del archivo original.
Finalmente, tuve que emprolijar un poco el archivo de texto, pero fue, notoriamente, menos trabajo que tener que ir copiando y pegando los contenidos de las cajas de texto.

No hay comentarios.:

Publicar un comentario

Lo que escriba a continuación será revisado antes de publicarse.
Gracias por tus comentarios.