transmogrify.wordpress incluía ya algunas secciones para importar desde formato WXR, pero nosotros no teníamos acceso a la interfaz de administración del sitio, sólo a la de phpMyAdmin; por eso terminamos escribiendo las nuevas secciones.

adicionalmente, me parece que usar las tablas de la base de datos te da mucha más flexibilidad pues tienes acceso a absolutamente todo por separado y no sólo a lo se exporta en WXR y parsear varios archivos en lugar de uno sólo gigantesco también puede tener ventajas.

el sitio que estamos importando tiene alrededor de 140.000 items en varios estados entre posts, páginas y archivos; el archivo que contiene essos posts mide casi 600MB en formato CSV de modo que extraer eso de formato XML podría ser quizás más complicado.

hace 2 días conseguí rodar por primera vez la sección completa sin errores y demoró 11 horas bajando todas las imágenes desde el servidor original.

al final terminé con lo siguiente:

posts: 18681
páginas: 0 (acabo de ver que aquí estamos con problemas)
imágenes: 32763
archivos: 102
carpetas: 9631

no es perfecto, pues tuvimos errores de parsing en 450 líneas, pero eso es menos del 1% del total del archivo.

conseguimos también editar el cuerpo del texto y substituir los links internos por las UUID de los objetos; también generamos los elementos relacionados.

falta generar algunos reportes al final de la importación, pero parece que vamos por buen camino.

ahora necesitamos importar algunas encuestas y esas son otras 3 tablas.

saludos

Héctor Velarde


Attachment: smime.p7s
Description: S/MIME Cryptographic Signature

_______________________________________________
Usuarios-Plone mailing list
[email protected]
https://lists.plone.org/mailman/listinfo/plone-usuarios-plone

Responder a