ONIX, DILVE Y Archivos CSV
Enviado por b3t0_86 • 12 de Mayo de 2013 • 5.660 Palabras (23 Páginas) • 351 Visitas
Índice
1 Introducción 1
1.1 ONIX, DILVE y archivos CSV 1
1.2 Necesidad de estandarizar los nombres de archivos 1
2 Campos de contenidos ricos 3
2.1 Enumeración 3
2.1.1 Descripciones y otros textos de apoyo 3
2.1.2 Archivos de imagen, audio y vídeo 4
2.2 Campos CSV 4
2.2.1 Introducción 4
2.2.2 Nombres de los campos 4
2.2.3 Contenido de los campos CSV 5
2.2.4 Textos embebidos en campos CSV 6
3 Gestión de los contenidos 8
3.1 Carga física vs. Referencia (Archivos de imágenes) 8
3.1.1 Envío físico del archivo 9
3.1.2 Envío de referencias a los archivos 9
3.2 Archivos de imágenes 10
3.2.1 Formas de envío 10
3.2.2 Formato 11
3.2.3 Tamaños 11
3.3 Campos de texto 13
3.3.1 Contenido de los campos CSV 13
3.3.2 Formato de los contenidos textuales 14
4 Nomenclatura de archivos 16
4.1 Convenios 16
4.1.1 Convenio general: 16
4.1.2 Convenio simplificado, para archivos de imagen 17
5 Envío de archivos CSV con archivos adjuntos 18
5.1 Proceso 18
5.1.1 Paso 1: Agrupación de ficheros en una misma carpeta 18
5.1.2 Paso 2: Selección y empaquetado en .zip 19
5.1.3 Paso 3: Envío del archivo a DILVE 21
6 Servicio de asistencia y soporte DILVE 22
Distribuidor de información del libro español en venta
Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)
1
1 Introducción
1.1 ONIX, DILVE y archivos CSV
Al estar basada en ONIX, la estructura interna de DILVE permite la inclusión en la ficha del libro de referencias a una gran variedad de contenidos ricos: imágenes, textos, etc.
Estos contenidos se dividen en tres grandes bloques1: Descripciones y otros textos de apoyo, que se detallan en el grupo ONIX PR-15. Las categor-ías de contenidos correspondientes se enumeran en la Lista ONIX 33. Enlaces a archivos de imagen, audio y vídeo, que se detallan en el grupo ONIX PR-16. Las categorías de elementos de este grupo se enumeran en la Lista ONIX 38. Elementos de contenido (en forma estructurada), que se detallan en el grupo ONIX PR-18. Las categorías de contenidos correspondientes se enumeran en la Lista ONIX 42.
Con el fin de permitir la gestión de contenidos ricos, para aquellas editoriales que no utilicen el formato ONIX, DILVE ha preparado un subconjunto de campos que permiten la carga y extracción de un elevado número de contenidos mediante archivos CSV.
Esos campos se enmarcan en los dos primeros bloques mencionados: Descripciones y otros tex-tos de apoyo, y Enlaces a archivos de imagen, audio y vídeo.
Los elementos del tercer bloque, Elementos de contenido, necesitan ONIX para su carga y requie-ren estar integrados en una estructura de campos jerarquizada por lo que sólo se pueden expre-sar, razonablemente, en formato XML-ONIX nativo.
En cualquier caso, es importante recordar, que todo elemento de contenido gestionado mediante campos en archivos CSV en DILVE, debe corresponder a algún elemento de contenido definido en ONIX, como es el caso de los expuestos en el presente documento.
En este documento se describen los campos de contenido que pueden cargarse o referenciarse mediante archivos CSV, así como los formatos requeridos por cada uno.
Este documento es un complemento del manual "Campos en archivos CSV", disponible en el web www.dilve.es.
1.2 Necesidad de estandarizar los nombres de archivos
En general, la finalidad de los archivos cargados o referenciados en DILVE es su visualización en la pantalla de un ordenador (o dispositivos similares), fundamentalmente en entornos web. Esto entraña unas características determinadas en cuanto a su formato, y su resolución, tamaño, peso (en el caso de imágenes) etc.
Por otra parte, la explotación de los recursos de DILVE por parte de los distintos usuarios se reali-zará, en general, mediante métodos automáticos: descargas masivas o periódicas para alimentar otras bases de datos (p.ej. CEGAL en Red), generación automática de catálogos, etc.
1 En esta relación se indican las Listas ONIX en las que se enumeran cada uno de los elementos de conte-nido, ya que estas tienen un papel importante en la creación de los nombres de los archivos correspondien-tes. Sin embargo, no es necesario conocer las listas. En este manual se dan todas las claves necesarias.
Distribuidor de información del libro español en venta
Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)
2
Dado que en DILVE coexisten muchos archivos correspondientes a distintos recursos de obras muy variadas, es fundamental adoptar un convenio en la nomenclatura de los archivos que simpli-fique su tratamiento automático, permitiendo saber, por ejemplo, de qué recurso se trata así como sus características: a qué obra corresponde, qué tamaño tiene, etc.
Efectivamente, una aplicación que realice una descarga masiva de datos de DILVE, se puede encontrar con varios miles de archivos de textos o imágenes. Sin un convenio estricto para los nombres de estos recursos, se pueden producir efectos no deseados: Si dos archivos distintos tienen el mismo nombre, uno de ellos "machacará" al otro. Por ejem-plo, supongamos que las editoriales A y B utilizan, ambas, el nombre cervantes.jpg para las imágenes de las cubiertas de sus libros Biografía de Cervantes (Editorial A) y Lectura crítica de los entremeses de Cervantes (Editorial B). Si ambos libros figuran en una descarga de DILVE, sólo se puede enviar un archivo con el nombre cervantes.jpg, con lo que ambos libros aparecerán con la misma imagen de la cubierta. Para uno de ellos, evidentemente, esta ima-gen será incorrecta. Si en el nombre del archivo figuran caracteres no aceptables en el entorno informático que procesa las extracciones de DILVE, se producirá un error en la aplicación, resultando imposi-ble procesar el archivo correspondiente, con lo cual se perderá la posibilidad de mostrar o procesar la imagen.
Es conveniente que, ante distintas versiones de un mismo archivo, se puedan determinar, de for-ma automática las características de cada uno.
En el Apartado 4 - Nomenclatura de archivos (pág. 16) se presenta el convenio para nombres de archivos recomendado por DILVE.
Distribuidor de información del libro español en venta
Cargas de textos e imágenes mediante CSV. v1 r10 (07/2012)
3
2 Campos de contenidos ricos
2.1 Enumeración
2.1.1 Descripciones y otros textos de apoyo
Dado que toda la información gestionada en DILVE sigue el estándar ONIX, todos los campos cargados deben estar recogidos en
...