Accueil > > > COMPTER LE NOMBRE DE PAGES D'UN FICHIER PDF
COMPTER LE NOMBRE DE PAGES D'UN FICHIER PDF
Information sur la source
Description
Ce petit code source permet de compter le nombre de pages dans un fichier PDF. Fonctionne au moins avec les PDF jusqu'au 1.4 les spécifications 1.5 voient entrer la compression de la table XRef... du coup, pour ce simple comptage, le code se voit allongé de deux a trois fois sa taille actuelle, d'après mes premières estimations. vu que j'ai écrit ce code rapidement, pour un cadre précis, avec des fichiers 1.4...
Source
- #if defined(WIN32)
- #define _CRT_SECURE_NO_WARNINGS
- #endif
-
- #include <stdio.h>
- #include <stdlib.h>
- #include <string.h>
-
- int CountPDFPage(char *Fichier) {
- FILE *pdf;
- unsigned int count = 0;
- int offset;
- int len;
- int i;
- int refCount;
- char *p;
- char buf[1024];
- unsigned int *XRef;
- if ((pdf = fopen(Fichier, "rb")) == NULL) {
- printf("Impossible d'ouvrir le fichier PDF.\n");
- return -1;
- }
-
- fread(buf, 1, 5, pdf);
- if (strncmp(buf, "%PDF-", 5)) {
- printf("fichier non PDF.\n");
- return -2;
- }
-
- fseek(pdf, 0, SEEK_END);
- offset = ftell(pdf)-60;
- fseek(pdf, offset, SEEK_SET);
- len = fread(buf, 1, 60, pdf);
- if (len!=60) {
- printf("fichier PDF corrompu\n");
- return -3;
- }
-
- buf[60] = 0;
- for(;;) {
- len = strlen(buf);
- if (len==60)
- break;
- else
- buf[len] = 32;
- }
-
- p = strstr(buf, "startxref");
- if (p==0) {
- printf("Erreur dans l'analyse du pdf. Impossible de trouver le StartXRef\n");
- return -4;
- }
-
- p+=10;
- while (*p==32 || *p==10 || *p==13) p++;
- offset = atoi(p);
- if (offset<=0) {
- printf("Erreur dans l'analyse du pdf. StartXRef==%d\n", offset);
- return -5;
- }
- fseek(pdf, offset, SEEK_SET);
-
- /* On récupère le nombre d'entree de la XRef */
- fread(buf, 1, 40, pdf);
-
- if (strncmp(buf, "xref", 4)) {
- printf("XRef incompatible. Peut être s'agit il d'un fichier PDF 1.5 ou superieur\n");
- return -6;
- }
-
- p=buf+4;
- while (*p==32 || *p==10 || *p==13) p++;
- while (*p>='0' && *p<='9') p++;
- while (*p==32) p++;
-
- refCount = atoi(p);
- if (refCount<=0) {
- printf("Erreur dans l'analyse du pdf. XRef==%d\n", refCount);
- return -7;
- }
-
- /* On va conserver la XRef en memoire. */
- XRef = malloc(sizeof(unsigned int)*--refCount);
- fseek(pdf, offset+32, SEEK_SET);
- for (i=0; i<refCount;) {
- len = fread(buf, 1, 1024, pdf);
- for(p=buf; i<refCount && p<(buf+len); p+=20) {
- XRef[i] = atoi(p);
- i++;
- }
- }
-
- /* Pour chaque object de la XRef... */
- for (i=0; i<refCount; i++) {
- fseek(pdf, XRef[i], SEEK_SET);
- fread(buf, 1, 1024, pdf);
- p = strstr(buf, "/Type ");
- if (p) {
- if (strncmp(p, "/Type /Pages", 12))
- break; /* Seuls les /Pages nous interessent... */
- p = strstr(buf, ">>");
- if (p)
- *p=0; /* Permet de ne pas tenir compte du 'trop-lu' du fichier */
- /* Un fichier PDF peut contenir n groupes de pages. */
- /* Seul l'element racine nous interesse : celui qui n'a pas de Parent */
- if (strstr(buf, "/Parent ") == NULL) {
- p = strstr(buf, "/Count ");
- if (p) {
- count = atoi(p+7); /* Voila notre nombre de pages */
- break;
- }
- }
- }
- }
-
- free(XRef);
-
- fclose(pdf);
- return count;
- }
-
- int main(int argc, char *argv[]) {
- int rc;
- if (argc!=2) {
- printf("Compte le nombre de pages d'un fichier PDF dont le chemin est donne en parametre.\n");
- return 1;
- }
- rc = CountPDFPage(argv[1]);
- if (rc>0) {
- printf("%d\n", rc);
- return 0;
- }
- printf("%d\n", rc);
- return rc;
- }
#if defined(WIN32)
#define _CRT_SECURE_NO_WARNINGS
#endif
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int CountPDFPage(char *Fichier) {
FILE *pdf;
unsigned int count = 0;
int offset;
int len;
int i;
int refCount;
char *p;
char buf[1024];
unsigned int *XRef;
if ((pdf = fopen(Fichier, "rb")) == NULL) {
printf("Impossible d'ouvrir le fichier PDF.\n");
return -1;
}
fread(buf, 1, 5, pdf);
if (strncmp(buf, "%PDF-", 5)) {
printf("fichier non PDF.\n");
return -2;
}
fseek(pdf, 0, SEEK_END);
offset = ftell(pdf)-60;
fseek(pdf, offset, SEEK_SET);
len = fread(buf, 1, 60, pdf);
if (len!=60) {
printf("fichier PDF corrompu\n");
return -3;
}
buf[60] = 0;
for(;;) {
len = strlen(buf);
if (len==60)
break;
else
buf[len] = 32;
}
p = strstr(buf, "startxref");
if (p==0) {
printf("Erreur dans l'analyse du pdf. Impossible de trouver le StartXRef\n");
return -4;
}
p+=10;
while (*p==32 || *p==10 || *p==13) p++;
offset = atoi(p);
if (offset<=0) {
printf("Erreur dans l'analyse du pdf. StartXRef==%d\n", offset);
return -5;
}
fseek(pdf, offset, SEEK_SET);
/* On récupère le nombre d'entree de la XRef */
fread(buf, 1, 40, pdf);
if (strncmp(buf, "xref", 4)) {
printf("XRef incompatible. Peut être s'agit il d'un fichier PDF 1.5 ou superieur\n");
return -6;
}
p=buf+4;
while (*p==32 || *p==10 || *p==13) p++;
while (*p>='0' && *p<='9') p++;
while (*p==32) p++;
refCount = atoi(p);
if (refCount<=0) {
printf("Erreur dans l'analyse du pdf. XRef==%d\n", refCount);
return -7;
}
/* On va conserver la XRef en memoire. */
XRef = malloc(sizeof(unsigned int)*--refCount);
fseek(pdf, offset+32, SEEK_SET);
for (i=0; i<refCount;) {
len = fread(buf, 1, 1024, pdf);
for(p=buf; i<refCount && p<(buf+len); p+=20) {
XRef[i] = atoi(p);
i++;
}
}
/* Pour chaque object de la XRef... */
for (i=0; i<refCount; i++) {
fseek(pdf, XRef[i], SEEK_SET);
fread(buf, 1, 1024, pdf);
p = strstr(buf, "/Type ");
if (p) {
if (strncmp(p, "/Type /Pages", 12))
break; /* Seuls les /Pages nous interessent... */
p = strstr(buf, ">>");
if (p)
*p=0; /* Permet de ne pas tenir compte du 'trop-lu' du fichier */
/* Un fichier PDF peut contenir n groupes de pages. */
/* Seul l'element racine nous interesse : celui qui n'a pas de Parent */
if (strstr(buf, "/Parent ") == NULL) {
p = strstr(buf, "/Count ");
if (p) {
count = atoi(p+7); /* Voila notre nombre de pages */
break;
}
}
}
}
free(XRef);
fclose(pdf);
return count;
}
int main(int argc, char *argv[]) {
int rc;
if (argc!=2) {
printf("Compte le nombre de pages d'un fichier PDF dont le chemin est donne en parametre.\n");
return 1;
}
rc = CountPDFPage(argv[1]);
if (rc>0) {
printf("%d\n", rc);
return 0;
}
printf("%d\n", rc);
return rc;
}
Conclusion
Rien de bien sorcier, mais outil bien utile au quotidien (enfin, dans mon quotidien en tous cas)
Historique
- 14 février 2012 08:42:10 :
- J'ai utilisé la commande gcc -W -Wall -ansi -pedantic pdf_pagecount.c -g
sur mon AIX cible, afin de voir plus de Warnings, et de les corriger. (Merci CptPingu)
J'en ai profité pour ajouter un test: vérifier que le fichier commence bien par %PDF-
- 14 février 2012 11:20:43 :
- Ajout de davantage de controles sur le Pdf
- 14 février 2012 11:21:38 :
- Erreur de mise a jour
- 16 février 2012 09:34:16 :
- Ajout de commentaires
Sources du même auteur
Sources de la même categorie
Commentaires et avis
Discussions en rapport avec ce code source dans le forum
Retours à la ligne [ par Gerald ]
Quelqu'un pourrait-il me dire comment faire pour compter le nombre de retours à la ligne dans un fichier texte?voici mon programme Dos:unsigned int n,
Comment compter le nombre d'espaces [ par xabi62 ]
Je voudrais savoir comment il faut faire pour compter le nombre de mots dans une phrase, je pense qu'en comptant le nombre d'espace, on doit pouvoir l
API pour visualiser des pages HTML???????? [ par Tropdemalaveclesapi ]
QQN connait une api pour afficher à l'écran une page HTML? merci à tous de réfléchir à la question!
Compter les lignes d un fichier texte [ par DeepThroat ]
Bonjour a tous !J'aimerai trouver une fontion simple qui retourne le nombre de lignes dans un fichier , ou bien qui affiche ce nombre de lignes.j'imag
fichier pdf [ par llo ]
l'losalut,je recherche le glossaire sur la syntaxe interne des fichiers pdf (acrobat).1 - objectif : générer par codes des pages non modifiables2 - ob
COMPTER LE NOMBRES D'IMPRESSIONS [ par bilal ]
VGTABONJOUR G cherché et essayé et toujour pas trouvé ou je dois attaquer pour faire mon petit soft.enfait je voudrai juste compter le nombre d'impres
COMPTER le nbr d impression [ par bilal ]
VGTAVGTABONJOUR G cherché et essayé et toujour pas trouvé ou je dois attaquer pour faire mon petit soft.enfait je voudrai juste compter le nombre d'im
compter et extraire des mots : I NEED HELP !!!!! [ par ben01n ]
salut j'ai une variable "buf" qui contient une phrase saisie par l'utilisateurje voudrais compter le nombre de mots puis les extraires un par un pour
generer du pdf ou rtf en C++ -=help=- [ par cartouh ]
voila, je suis en train de faire une appli qui travaille des images grace à la lib FreeImage (mici BruNews).une fois que j'ai ces images, je voudrais
nombre de pages imprimés [ par revelata ]
Salut,je dois compter les pages imprimés par utilisateur sur une imprimante! J'utilise IADS ou winspool.hµ? Si vous avez des exemples, merci...
|
Derniers Blogs
IMAGINE CUP 2012, MAKE A SIGN EN FINALEIMAGINE CUP 2012, MAKE A SIGN EN FINALE par junarnoalg
Voilà qui est fait, la nouvelle est officielle ! L'équipe belge "Make a Sign" va au pays des kangourous défendre son projet dans la catégorie Software Design. http://www.imaginecup.com/CompetitionsContent/Competition/WorldwideFinalists.aspx V...
Cliquez pour lire la suite de l'article par junarnoalg KINECT 1.5 IS OUT !KINECT 1.5 IS OUT ! par Vko
La version 1.5 du Kinect For Microsoft vient tout juste de sortir ! Plein de nouveautés: Tracking de squelette en Near Mode Détection en position assise Détection faciale avec un SDK dédié Documentation et des guideline (enfin) Un out...
Cliquez pour lire la suite de l'article par Vko LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) LES ACTUALITéS DE LA SEMAINE SUR C2I.FR (14 MAI - 20 MAI) par richardc
Mise à jour des Web API du 14 Mai
Réservez dès maintenant votre journée du 20 juin pour le Windows Azure Dev Camp 2012 à Paris
Mise à jour de Team Foundation Service
MechCommander 2 sur Windows 8
Entity Framework 5 Release Candidate e...
Cliquez pour lire la suite de l'article par richardc REACTIVE EXTENSIONS : CONSOMMER DES SERVICES AVEC RX PARTIE 3, LES PIèGES à éVITERREACTIVE EXTENSIONS : CONSOMMER DES SERVICES AVEC RX PARTIE 3, LES PIèGES à éVITER par Groc
Une mauvaise utilisation de rx lors de l'écriture d'une couche d'accès à des services peut conduire à des cas embarassants avec des erreurs mal gérées, des appels qui ne partent lorsqu'ils le devraient, et même des résultats incorrects . le tout nuis...
Cliquez pour lire la suite de l'article par Groc SHAREPOINT BLOG SITE, PROBLèME D'ARCHIVESSHAREPOINT BLOG SITE, PROBLèME D'ARCHIVES par junarnoalg
Dernièrement, nous avons migré le site
myTIC
vers un nouveau serveur SharePoint 2010. Dans les contenus que nous vouloins récupérer, nous avions un certain nombre de blogs.
Nous avons utilisé les commandes Power...
Cliquez pour lire la suite de l'article par junarnoalg
Forum
MATRICE TEMPLATEMATRICE TEMPLATE par hjr2610
Cliquez pour lire la suite par hjr2610 RE : SAC A DOS RE : SAC A DOS par hadjkaddour
Cliquez pour lire la suite par hadjkaddour
Logiciels
sDEVIS-FACTURES vlPRO (8.1.0.3)SDEVIS-FACTURES VLPRO (8.1.0.3)sDEVIS-FACTURES vlPRO a été mis au point pour les particuliers, créateurs, entrepreneurs, artisa... Cliquez pour télécharger sDEVIS-FACTURES vlPRO 974 Application Server (12.2.4.6)974 APPLICATION SERVER (12.2.4.6)Développez de puissantes applications dans un environnement de 'cloud computing', clusterisé, séc... Cliquez pour télécharger 974 Application Server vPicture (1.4.2.1)VPICTURE (1.4.2.1)Avec vPicture, hébergez vos images facilement et rapidement.
vPicture est un utilitaire simple, ... Cliquez pour télécharger vPicture Easy-Planning (2.2.1.6)EASY-PLANNING (2.2.1.6)Easy-Planning permet de créer des plannings sous la représentation de diagrammes et est adapté au... Cliquez pour télécharger Easy-Planning COM-BACKUP (2.0)COM-BACKUP (2.0)
COM-BACKUP est un logiciel de sauvegarde qui permet de planifier les sauvegardes de vos dossiers ...
Cliquez pour télécharger COM-BACKUP
|