In questo articolo parliamo di come, partendo da un documento PDF che segue una struttura predefinita, sia possibile ottenere un XML contenente gli stessi dati. Quest’ultimo, può essere poi sfruttato all’interno di programmi che recuperano, analizzano ed elaborano dati.

B£_165

Schema che mostra come, tramite la B£_165, il documento passi da PDF a XML

La B£_165 è una /copy la cui attuale unica funzione è quella di estrapolare, in formato XML, i dati contenuti in un documento PDF. Il suo potenziale futuro è però molto elevato: sempre partendo da PDF, questa /copy può infatti produrre qualsiasi formato di output.

Come anticipato nell’introduzione, per poter eseguire la conversione, il file originale deve seguire una struttura specifica che viene definita in un file di configurazione. Quest’ultimo viene fornito in fase di input e contiene delle istruzioni create ad hoc. Per questo motivo non è possibile convertire la scansione di un documento PDF.

I passaggi sono quindi i seguenti:

  1. eseguire l’input del documento PDF e della relativa configurazione;
  2. B£_165 chiama i webservice, i quali leggono il pacchetto di configurazione ed estrapolano l’XML;
  3. la stessa /copy fornisce in output il file in formato XML.

Se l’operazione ha avuto successo, è stato creato un file XML contenente dati equivalenti al PDF iniziale.

Consigliamo la visione di questo video per un riepilogo di quanto detto sopra e per esaminare la B£_165 all’opera su Webup.

Come sfruttare questa /copy?

È possibile trovare un esempio di utilizzo riservato a Smeup della /copy nella UPP X1_X57. L’obiettivo di quest’ultima è dimostrare che si è in grado di verificare la congruenza tra i dati recuperati all’interno del  PDF del collaboratore e quelli memorizzati a sistema.

Partendo da un PDF contenente le informazioni relative ad un collega, si procede tramite la B£_165 all’estrapolazione dei dati ed alla creazione automatica di un XML equivalente.

Step 1 del procedimento dimostrativo di lettura del PDF

Dal file XML vengono estrapolati i dati…

Step 2 del procedimento dimostrativo di lettura del PDF

… che poi vengono salvati in un record della C£_102 (file CF).

Step 3 del procedimento

A questo punto si può procedere con il confronto dei dati per verificarne la congruenza con quelli memorizzati a sistema.

Step 4 del procedimento

Il risultato del confronto è andato a buon fine e può essere visto qui sotto:

Esito del controllo del PDF

Il processo appena spiegato può sembrare abbastanza complicato, ma la realtà è che il tutto avviene in pochi semplici click.