Combien de pages pour une thèse ou un mémoire?

Vous aimerez aussi...

6 réponses

  1. Etienne Carbonneau dit :

    Bonjour,
    Votre texte est intéressant, mais la mention de la plus courte thèse mérite une revérification. Le texte mentionné est en fait un mémoire doctoral en vue du titre de D. Psy, soit un diplôme associé à la pratique professionnelle de la psychologie clinique. Ce n’est pas un doctorat ni une thèse au sens Ph.D associé à des thèses autrement plus touffue.

    • JH dit :

      Merci, M. Carbonneau, d’avoir relevé ce fait. J’avais téléchargé le document PDF, mais n’avait pas reconnu qu’il s’agissait d’un mémoire doctoral. J’avais exclu les essais de troisième cycle que je pouvais identifier (ils ne sont pas toujours faciles à repérer). Je vais aussi exclure les mémoires doctoraux. Bonne année 2017!

  2. Vous écrivez au sujet du document https://papyrus.bib.umontreal.ca/xmlui/handle/1866/9049
    (qui devrait plutôt être référencé par http://hdl.handle.net/1866/9049)

    « Le document PDF ne compte que 11 pages seulement. Mais quand l’on ouvre et qu’on lit la table des matières, on constate qu’il devrait en réalité faire plus de 78 pages. En fait, le PDF ne contient que les pages liminaires du doctorat. Où est le reste? Mystère. »

    Il y a une note à cet URL précis qui dit: « La version intégrale de cette thèse est disponible uniquement pour consultation individuelle à la Bibliothèque de musique de l’Université de Montréal (www.bib.umontreal.ca/MU). » Voilà donc où est le reste…

    Enfin comme il est stipulé sur le site, pour la collection des thèses et mémoires en musique (http://hdl.handle.net/1866/2968):

    Cette collection contient:
    •Les fiches signalétiques des thèses et mémoires des étudiant(e)s de la Faculté de musique de l’Université de Montréal déposé(e)s entre le 1er octobre 2009 et le 1er novembre 2014. Pour ces documents, une version complète est disponible pour consultation individuelle à la Bibliothèque de musique de l’Université de Montréal (http://www.bib.umontreal.ca/MU).
    • La version intégrale des thèses et mémoires des étudiant(e)s de la Faculté de musique de l’Université de Montréal (composition et musicologie) déposés après le 1er novembre 2014 ou encore une version tronquée des éléments pouvant aller à l’encontre du respect des droits d’auteur et, s’il y a lieu, un lien vers une version plus complète de la thèse ou du mémoire en vue d’une diffusion restreinte à la communauté UdeM.

    ***

    Cette décision fût prise à l’origine par les responsables de la Faculté pour ne pas enfreindre le droit d’auteur, notamment dans le cas des thèses et mémoires en composition. Cette position a depuis été revue.

    En espérant avoir pu élucider votre mystère….

    • JH dit :

      Merci, Mme Vézina, d’avoir pris le temps de m’écrire ce commentaire! C’est apprécié! J’ai fait référence à votre explication dans mon texte. Bonne année 2017! 🙂

  3. Suggestions de démarches alternatives/complémentaires (que vous avez peut-être considérées; j’avoue ne pas être allée voir le détail sur votre GitHub):

    1. Interroger en z39.50 les catalogues de bibliothèques (ex. à l’UdeM nos paramètres d’interrogation z39.50 sont décrits ici: http://www.bib.umontreal.ca/aide-atrium/) et extraire ainsi toutes les notices MARC de thèses et mémoires (ici à l’UdeM on a une chaîne de caractères unique dans un champ MARC donné pour identifier qu’il s’agit d’une thèse ou d’un mémoire. Cette chaîne est repérable en cherchant dans tous les index: @attr 1=1016 « TheseUdeM », ou par ex. pour une seule année: (@and @attr 1=1016 « TheseUdeM » @attr 1=30 « 1950 »)). Le format MARC étant plus ou moins facile à consulter et manipuler, un convertisseur gratuit tel MarcEdit vous permettra de faire des transformations en lot vers des formats MARCXML ou encore en texte plus aéré (reproduit ci-après).

    Ex. d’une notice MARC:

    01003cam 22002651 4500001001000000003000600010005001700016008004100033035002100074035001900095035001300114040002200127090002900149090003200178100002600210245021200236260005100448300001100499502005200510610005400562650004100616650003800657730002800695793001400723000589358CaQMU20111211191334.0821027s1950 quc fre x a(OCoLC)8691659819 aCaQMUb10084524 a79012169 aCaQMUbfrecCaQMU0 aHV/13/U54/1950/v.002bTS0 aHV/13/U54/1950/v.002bSSc21 aBeaulieu, Marguerite.13aLa clinique d’aide à l’enfance — étude descriptive du fonctionnement actuel de la Clinique d’aide à l’enfance, attachée à la Cour des jeunes délinquants de Montréal, et des services qu’elle a rendus.0 a[Montréal] :bUniversité de Montréal,c1950 a106 f. aThèse (M.A.) — Université de Montréal, 195026aClinique d’aide à l’enfance, Montréal, Québec. 6aDélinquance juvénilexPrévention. 0aJuvenile delinquencyxPrevention.0 aThèse. Service social. aTheseUdeM

    Ex. une fois convertie pour plus de lisibilité:

    =LDR 01003cam 22002651 4500
    =001 000589358
    =003 CaQMU
    =005 20111211191334.0
    =008 821027s1950\\\\quc\\\\\\\\\\\\\\\\\fre\x
    =035 \\$a(OCoLC)869165981
    =035 9\$aCaQMUb10084524
    =035 \\$a79012169
    =040 \\$aCaQMU$bfre$cCaQMU
    =090 0\$aHV/13/U54/1950/v.002$bTS
    =090 0\$aHV/13/U54/1950/v.002$bSS$c2
    =100 1\$aBeaulieu, Marguerite.
    =245 13$aLa clinique d’aide à l’enfance — étude descriptive du fonctionnement actuel de la Clinique d’aide à l’enfance, attachée à la Cour des jeunes délinquants de Montréal, et des services qu’elle a rendus.
    =260 0\$a[Montréal] :$bUniversité de Montréal,$c1950
    =300 \\$a106 f.
    =502 \\$aThèse (M.A.) — Université de Montréal, 1950
    =610 26$aClinique d’aide à l’enfance, Montréal, Québec.
    =650 \6$aDélinquance juvénile$xPrévention.
    =650 \0$aJuvenile delinquency$xPrevention.
    =730 0\$aThèse. Service social.
    =793 \\$aTheseUdeM

    En fonction des pratiques de catalogage des différentes institutions et à travers les années vous obtiendrez vraisemblablement, dans la zone 300, sous-zone « a », le nombre de pages.

    Ex.:

    =300 \\$ax, 125 f.
    =300 \\$a2 v. (cclxi, 173 f.) :$bill.
    =300 \\$axxx, 117 f. :$bgraph.
    =300 \\$axviii, 112, [9] f. :$bgraph.
    =300 \\$ax, 120, [1] f.

    Il est ensuite aisé d’écrire un script avec le language de votre choix (Perl, Python, al.) pour extraire cette information et faire les additions des pages liminaires (en additionnant les sections en chiffres romains et arabes). La description de la syntaxe devant être utilisée dans cette zone est décrite ici: http://www.marc21.ca/MaJ/BIB/B300.pdf

    Vous aurez invariablement quelques erreurs de chiffres romains qui proviennent ou de l’auteur, ou du catalogueur (exemples: xiiii, xlx, xlxv) et quelques limites: ex. parfois « 2 v. » pour 2 volumes sans que le nb de pages ne soit spécifié. Celà dit ceci constitue une bonne estimation. C’est une approche que j’ai moi-même employée pour estimer le nombre de pages à numériser dans le cadre d’éventuel projets de numérisation de ce type de document.

    2. Beaucoup d’universités ont abandonné le dépôt papier des thèses et mémoires au cours des dernières années pour aller vers un dépôt électronique.
    La plupart de ces documents sont versés dans des dépôts institutionnels et les schémas de métadonnées employées pour décrire ces documents ne comportent pas toujours un élément d’information concernant le nombre de pages. Il peut y avoir ou non une notice également versée au catalogue (automatiquement ou comportant des enrichissements).
    À l’UdeM, les thèses et mémoires sont déposés en format électronique depuis 2009 (et plusieurs projets de numérisation rétrospective sont venus grossir le nombre de documents électroniques disponibles) et ne font pas l’objet d’une notice en format MARC. Dans ce cas il peut être intéressant d’interroger en OAI-PMH le dépôt institutionnel pour avoir l’ensemble des thèses et mémoires (plus d’informations ici: https://papyrus.bib.umontreal.ca/xmlui/page/interrogation-a-distance):

    On peut lister uniquement les identifiants des documents du grand ensemble « Thèses et mémoires électroniques de l’Université de Montréal »
    https://papyrus.bib.umontreal.ca/oai/request?verb=ListIdentifiers&metadataPrefix=etdms&set=col_1866_2621

    On peut ensuite obtenir les métadonnées bibliographiques en divers format (ici en etdm) pour chaque document en reprenant son identifiant (ex.: oai:papyrus.bib.umontreal.ca:1866/10306):

    https://papyrus.bib.umontreal.ca/oai/request?verb=GetRecord&metadataPrefix=etdms&identifier=oai:papyrus.bib.umontreal.ca:1866/10309

    [Vous remarquerez que la plupart des universités canadiennes qui versent leurs thèses à la Bibliothèque nationale de Canada se conforme au format ETDM *et* y ont ajouté une extension pour y faire inscrire le nom du fichier .pdf principal de la thèse ou du mémoire (voir contenu de l’élément obtenu dans la requête plus haut)]

    Plus intéressant, on peut obtenir la structure des composantes du document en OAI-ORE:

    https://papyrus.bib.umontreal.ca/oai/request?verb=GetRecord&metadataPrefix=ore&identifier=oai:papyrus.bib.umontreal.ca:1866/10309

    Et donc le lien direct vers le ou les fichiers de la thèse (description « ORIGINAL »), ex.: rdf:about= »https://papyrus.bib.umontreal.ca/xmlui/bitstream/1866/10309/2/Kassir_Nastya_2012_these.pdf »>

    ou encore avoir à la fois les métadonnées et le document en METS:

    https://papyrus.bib.umontreal.ca/oai/request?verb=GetRecord&metadataPrefix=mets&identifier=oai:papyrus.bib.umontreal.ca:1866/10309

    Le nombre de pages peut ensuite être extrait des fichiers PDF avec une méthodologie semblable à celle que vous avez employée. Un programme maison d’interrogation et d’extraction des fichiers PDF devra encadrer le tout.

    • JH dit :

      Merci pour ce long commentaire! Tous les détails qu’il contient sont précieux! 🙂
      Pardon d’avoir tant tardé à y répondre. Le début de session a été intense et je ne suis pas retourné voir mon blogue assez souvent…
      J’ai demandé, justement, les données de BAC, mais n’ai jamais obtenu de réponse. Je devrai revenir à la charge!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *