Variables dépendantes et explicatives : Brevets et citations
2. Données et Méthode d’Estimation
2.1 Bases de données
Cette étude repose sur deux principales sources de données. Nous avons tout d’abord extrait les données de brevets et de citations de la base du National Bureau of Economic Research (NBER) développée et mise à disposition par Hall et al. (2001).
Nous y avons extrait l’ensemble des brevets déposés dans les classes 424 et 514 de l’United States Patent and Trademark Office (USPTO), soit les classes concernant exclusivement les médicaments au sens restreint du terme25 (Drug, BioAffecting and Body Treating Compositions) sur la période 1965-1999.
Nous avons ensuite comptabilisé, individuellement, le nombre de citations reçues et faites en récupérant la liste des brevets cités et citant afin de construire différents indicateurs d’innovation.
A partir de la base obtenue, nous n’avons gardé que les firmes ayant déposé durant au moins trois années consécutives des brevets à l’USPTO dans les deux classes considérées.
Cette restriction permet de se concentrer sur un échantillon de firmes dont l’activité d’innovation en matière de médicaments apparaît significative et statistiquement exploitable (rappelons que parmi les brevets déposés seule une faible part d’entre eux conduira à la commercialisation d’un nouveau médicament).
Nous introduisons donc volontairement un biais en ne considérant pas les innovateurs occasionnels car ils ne sont pas représentatifs des firmes pharmaceutiques qui déposent très fréquemment des brevets.
L’ensemble des variables financières qui sont utilisées dans les régressions sont corrigées de l’inflation selon les indices de prix proposés par l’OCDE et sont présentées en dollars base constante 1994. Les variables retenues sont les dépenses de R&D, le Chiffre d’Affaires et la Part de Marché de chaque firme au niveau annuel.
Après avoir réuni les deux bases de données via le code CUSIP des firmes (Commitee on Uniform Security Identification Procedure), gardé les firmes classifiées uniquement comme fabricant de médicaments (code SIC26 : 2834 “Pharmaceutical Preparations”) puis éliminé les firmes mal ou insuffisamment recensées sur la période, nous avons obtenu un échantillon de 77 laboratoires pharmaceutiques américains sur la période 1975-1999.
Ces firmes sont recensées continuellement par Compustat et la base de brevets du NBER et forment un panel non balancé.27
25 Les laboratoires pharmaceutiques déposent généralement de nombreux brevets en chimie (ce qui est particulièrement le cas avec les méthodes de “random screening”) pour protéger des molécules potentiellement exploitables ensuite en pharmacie ; les classes dites “pharmaceutiques” concernent donc exclusivement les médicaments, c’est-à-dire les résultats les plus avancés de leurs activités de recherche. En ne retenant que ces classes nous nous limitons donc à la partie en aval des activités de recherche des laboratoires.
26 Standard Industrial Classification.
Nous avons ensuite restreint notre fenêtre d’analyse à la période 1975-1991 pour plusieurs raisons. Premièrement, les années 1990 sont marquées par une forte restructuration du secteur. Ainsi en 1985 les dix firmes les plus importantes représentaient 20% des ventes mondiales contre 48% en 2002.
Durant la période 1988-2000, l’activité de fusions-acquisitions (F&A) représente alors 500 milliards de dollars de transactions (Danzon et al., 2004).28
Si nous considérons que ces opérations de F&A ont des déterminants technologiques (voir notamment le chapitre III qui est consacré à ce thème), nous admettons alors que dans l’analyse de la persistance à innover l’inclusion de cette période peut induire un biais : l’acquisition externe de connaissances par l’intermédiaire de F&A pourrait en effet se substituer à l’innovation au niveau interne et tronquer l’observation des comportements.
Deuxièmement, comme mentionné en introduction, entre 12 et 15 années sont nécessaires pour qu’un brevet conduise à un médicament commercialisé.
Ainsi, avec des données de brevets sur la période 1975-1991, nous analysons bien les tendances récentes en matière de lancement de nouveaux médicaments : le déclin de l’innovation actuellement observé via le faible renouvellement technologique s’explique donc par les dépôts de brevets faits il y a 12 à 15 années.
Troisièmement, l’utilisation de brevets pose un double problème de troncation : d’une part il existe un certain laps de temps entre le dépôt d’un brevet et son octroi qui tend à biaiser l’évaluation du nombre de dépôts en fin de période (voir Hall et al., 2001, 2005 pour des discussions sur ce point) et d’autre part, pour chaque brevet déposé, nous ne pouvons observer les citations qu’il reçoit que par les brevets déposés jusqu’en 1999.
27 Relativement peu de firmes sont recensées continuellement sur la période 1975-1995 par Compustat pour les variables considérées et la méthode empirique employée ne permet pas d’utiliser un panel discontinu. Le fait qu’elles doivent en outre apparaître dans le fichier qui permet d’associer les identifiants USPTO et Compustat (voir Hall et al., 2001) et déposer durant au moins trois années consécutives des brevets dans les classes 424 et 514 explique le nombre de firmes retenues (77). Par ailleurs aucune interpolation de données n’a été faite de sorte que les firmes retenues dans la base se présentaient originellement sans information manquante sur l’ensemble du panel et pour l’ensemble des variables considérées.
28 NBER Working Paper No. 10536, actuellement en révision au RAND Journal of Economics
De ce fait les brevets octroyés en fin de période reçoivent mécaniquement moins de citations que les brevets de début de période, simplement parce que la fenêtre d’observation des citations reçues est plus petite (de même pour les dépôts : parmi ceux déposés en fin de période on n’observe qu’une partie des octrois).
Pour corriger ce problème Hall et al. (2001) et Hall et al. (2005) proposent de normaliser29 les flux de citations reçues ainsi que l’utilisation d’un facteur de pondération basé sur la distribution application/octroi des brevets.
Le raccourcissement de notre panel à une période plus ancienne nous permet, en plus de l’application de ces méthodes, de minimiser les problèmes de troncations qui pourraient néanmoins subsister. Hall et al. (2005) notent en outre que l’utilisation des citations reçues en vue d’évaluer l’importance des innovations nécessite de toute manière un certain recul temporel.
2.2 Variables dépendantes et explicatives
Un des principaux apports de ce travail est d’avoir recours à trois différentes mesures de l’innovation des firmes. Ces trois mesures nous permettent d’avoir un regard non plus seulement quantitatif mais aussi qualitatif puisque chacune d’elles révèle différents aspects de la valeur technologique des innovations : l’appropriation/exclusion, l’influence technologique et la dépendance vis-à-vis des technologies existantes.
La première mesure de l’innovation, la plus répandue dans la littérature, est le comptage annuel des brevets déposés par une firme donnée (variable dénommée dépôts de brevets Non Ajustés-NApar la suite).
Cette mesure tient alors compte de toutes les “innovations”, des plus significatives aux plus stratégiques (au sein des classes 424 et 514 de l’USPTO).
La deuxième mesure permet de prendre en compte l’importance, ou l’influence, technologique des innovations. Il s’agit du nombre moyen de citations reçues par brevet (dénommé dépôts de brevets Ajustés par les Citations -ACpar la suite, voir Hall et al. 2001, 2002 et 2005).30
29 La méthode de normalisation consiste à estimer la forme de la distribution des citations dans le temps et, en la supposant stationnaire et indépendante des intensités de citations, d’estimer le nombre total de citations d’un brevet donné en divisant le nombre de citations observées par la fraction de la distribution des points qui appartiennent au même intervalle de temps pour lequel les citations sont observées ; voir Hall, Jaffe et Trajtenberg (2000, 2001) pour les détails pratiques de cette méthodologie.
30 Il est à noter sur ce point que l’USPTO (USA) et l’EPO (Europe) diffèrent sensiblement sur le recensement des citations. Alors qu’à l’EPO n’est rapporté que le minimum des citations nécessaires pour couvrir l’état de l’art, à l’USPTO toutes les citations pertinentes doivent être présentées.
Pour cela nous recensons pour chaque brevet le nombre total de citations reçues sur l’ensemble de la période. Ensuite, pour chaque année, nous divisons le nombre de citations reçues par celui des brevets déposés qui sont cités.
Ainsi, une firme qui a déposé 2 brevets en 1985, le premier brevet recevant 20 citations et le deuxième 2 citations, aura un compte “Ajusté par les Citations” de 11 (soit [20 + 2]/2).
Si maintenant nous comparons cette firme avec une autre firme qui n’aurait déposé qu’un brevet cette année recevant 15 citations, alors la deuxième firme apparaîtra avoir une influence moyenne plus forte car le nombre moyen de citations reçues par ses brevets (un seul ici) est supérieur à celui de la première firme (15 > 11).
Cet indicateur d’innovation rend ainsi compte de l’influence technologique relative qu’une firme a sur le secteur : plus la valeur est importante, plus chaque brevet déposé par la firme a une influence moyenne forte et donc plus son comportement général est innovant.
Notons que cette valeur décroît avec le nombre de brevets déposés dans l’année et croit avec le nombre de citations reçues par ces brevets ; elle rend donc bien compte d’un réel effort d’invention et contourne les problèmes d’utilisation stratégique du brevet.
En effet, si l’on fait l’hypothèse qu’un brevet déposé “stratégiquement” n’a qu’une faible valeur technologique, plus une firme utilise les brevets à des fins stratégiques moins elle recevra de citations en moyenne par brevet.
On comprend alors que les innovations les moins significatives, comme par exemple les nouvelles générations de produit qui offrent des progrès mineures par rapport à la molécule originale, seront moins citées que le brevet qui protège le principe actif original.
Le troisième indicateur utilisé prend en compte à la fois l’influence et la dépendance technologique des innovateurs via leurs innovations. Il s’agit du compte annuel des innovations les plus significatives, c’est à dire les innovations pionnières.
Ces innovations sont celles qui sont protégées par des brevets ayant à la fois une forte influence et une faible dépendance technologique par rapport aux brevets déposés la même année. Ces brevets sont donc influents et radicaux relativement aux brevets qui leur sont comparables (même classe technologique et même année de dépôt).
Une innovation sera considérée comme “pionnière” relativement aux médianes annuelles des flux de citations reçues et faites par l’ensemble des brevets appartenant aux mêmes classes (classes 424 et 514 de l’USPTO, cf. supra).
Une variable muette identifie donc les brevets “pionniers” comme indiqué sur la figure II.1. La variable Brevets Pionniers (-BP-) correspond alors annuellement au total de brevets identifié comme il suit :
Fig. II.1 – Brevets Pionniers
Notons que les points structurels de comparaisons servant à identifier les brevets pionniers sont les médianes annuelles des flux de citations reçues et faites. Rappelons que, d’après l’étude de Hall et al. (2005), en dessous de la médiane le nombre de citations reçues par brevet n’a pas d’impact significatif sur la valeur boursière des firmes.
Le choix de cette limite n’est donc pas arbitraire. Le recours aux médianes permet en outre de tenir compte des variations conjoncturelles dans le compte des citations et d’éliminer tout biais possible résultant des problèmes de troncations mentionnés plus haut.
D’autre part, cette construction étant faite sur la base de comparaisons annuelles, un brevet n’est considéré comme radical que relativement aux autres (ce qui implique que son identification en tant que “brevet pionnier” est liée à la date de son dépôt) ; néanmoins la double exigence en termes de citations n’implique pas qu’une part prédéterminée des brevets déposés une année donnée soit radicale (ou pionnière).
En termes de proportions ces brevets représentent environ 10% du total des brevets déposés (voir les statistiques descriptives : tableaux II.1 et II.2). La variable dépendante “Brevets Pionniers” est alors, pour une firme et une année donnée, le comptage des brevets identifié comme pionniers selon le critère de sélection présenté par la figure II.1.
A l’instar de Blundell et al. (1999), les variables explicatives sont toutes retardées d’une année par rapport à la variable dépendante considérée (c’est à dire le nombre annuel, par firme, des brevets Non Ajustés, Ajustés par les Citations ou Pionniers).
Ce retard est justifié notamment par le fait que pour étudier la relation causale de nos variables sur les dépôts de brevets des firmes, un recul est nécessaire.
Comme la relation temporelle entre R&D et brevet est très courte (voir Hall, Griliches et Hausman, 1986) un retard d’un an seulement est appliqué entre variables indépendantes et dépendantes.
Au niveau des données financières, nous avons retenu le chiffre d’affaires pour rendre compte du niveau de l’activité commerciale de la firme (ce qui rend compte du nombre de médicaments que la firme a déjà sur le marché) et de sa capacité de financement. Nous avons aussi retenu la part de marché pour rendre compte de l’importance économique relative de la firme.
La part de marché est calculée annuellement par rapport au chiffre d’affaires de l’industrie (c’est-à-dire de l’ensemble des firmes pharmaceutiques recensées dans Compustat), les données ne nous permettant malheureusement pas de calculer les parts de marchés plus finement (par segment d’activité ou classes thérapeutiques notamment).
Le niveau retardé de l’activité commerciale, et/ou la part de marché, devraient être positivement corrélés avec les flux d’innovations si l’effet d’efficience attribué à la domination des firmes l’emporte sur l’effet de déplacement (cf. supra).
La corrélation devra être négative dans le cas inverse. Comme nous utilisons plusieurs mesures d’innovation, il est vraisemblable que la nature de cette relation diffère selon l’indicateur considéré.
Le déclin de l’innovation (ou la fin d’un cycle) laisserait supposer que, selon le principe de la création destructrice, les firmes les plus importantes (c’est à dire ayant déjà un niveau d’activité élevé grâce à leurs innovations passées) ne sont pas les principales sources du changement technique et donc les innovateurs ayant le plus d’influence.
Dans ce cas ces deux variables devraient être négativement corrélées avec les dépôts de brevets ajustés par les citations et les dépôts de brevets pionniers.
Si, par ailleurs, les firmes dominantes ont une forte propension à utiliser le brevet à des fins stratégiques (forclusion, préemption, ever greening, lancement de “me-too” etc), alors le chiffre d’affaires et/ou la part de marché devraient être positivement corrélées avec les dépôts de brevets non ajustés.
Si par contre ces firmes sont des innovateurs pionniers, ou technologiquement influents, grâce aux ressources qu’elles peuvent engager en R&D notamment, ces variables devraient être positivement corrélées avec les dépôts de brevets ajustés et pionniers.
L’impact des dépenses de R&D est moins ambigu : ces investissements doivent expliquer les différents flux de dépôts de brevets car la R&D se trouve nécessairement en amont du processus d’innovation.
Il est néanmoins vraisemblable que la valeur des coefficients croissent avec la valeur technologique des brevets de telle sorte que les innovations les plus influentes soient aussi celles qui nécessitent les plus gros efforts de R&D.
A cet égard les investissements en R&D devraient être les plus importants pour les brevets pionniers car ce sont des brevets peu cumulatifs (qui bénéficient donc moins des investissements passés) et relativement influents (qui sont donc technologiquement importants).
Ces investissements devraient ensuite être plus importants pour les brevets ajustés par les citations que pour le simple comptage des brevets si et seulement si les brevets les plus influents sont effectivement les brevets les plus innovants et, inversement, si les brevets les moins influents sont les plus stratégiques.
En effet, l’influence technologique d’une firme doit normalement refléter ses efforts de R&D alors qu’un nombre important de brevets peu influents doit plus refléter une stratégie de protection du marché qui ne devrait pas se refléter dans les investissements de R&D.
L’inclusion des dépenses de R&D permet en outre de vérifier l’hypothèse de Cohen & Klepper (1996) selon laquelle la persistance à innover découle plus de la capacité financière des firmes à investir continuellement en R&D que d’une réelle dynamique de l’innovation.
Selon cette hypothèse, les firmes les plus importantes sont les plus persistantes à innover simplement parce qu’elles ont plus de facilités à investir continuellement en R&D et non pas parce qu’il existe une relation causale entre les innovations (c’est-à-dire une dynamique de l’innovation).
Si la persistance à innover s’explique seulement par la continuité des dépenses de R&D (être innovateur persistant reviendrait donc à simplement maintenir les dépenses R&D), alors les coefficients sur les rétroactions des innovations passées ne peuvent être significatifs en même temps que ceux des dépenses de R&D (la deuxième variable dominant la première).
Si c’est malgré tout le cas, et donc s’il existe une dynamique propre à l’innovation (c’est à dire un lien de causalité entre les innovations d’une même firme), des effets d’apprentissage, nous devons nous attendre à ce que la R&D reste significative parallèlement à l’inclusion de variables retardées d’innovations (les rétroactions).
Dans le cas spécifique de l’industrie pharmaceutique rappelons cependant qu’une part importante de la R&D est effectuée après le dépôt du brevet. Les dépenses effectuées en t peuvent ainsi aussi expliquer le développement des innovations brevetées en t − 1.
Au niveau de l’innovation, nous introduisons un indicateur supplémentaire de qualité comme variable explicative. L’indice dit d’“Originalité” tel que proposé par Henderson, Jaffe et Trajtenberg (1998) est une mesure de la spécificité technologique des innovations.31
Son calcul, indiqué par l’équation (II.1), reprend celui d’un indicateur de concentration de type Herfindahl-Hirschmann (HH) en se basant sur les classes technologiques cités par le brevet considéré (classes de l’USPTO).
Cet indice mesure donc si les citations faites par un brevet donné sont technologiquement concentrées ou diversifiées.
Où N citi est le nombre de brevets cités par le brevet i avec k le nombre de classes technologiques différentes auxquelles appartiennent les brevets cités.
Plus cet indicateur est important, plus la concentration est faible et donc plus l’innovation considérée est inspirée d’un spectre technologique large (l’indicateur est du type [1 − H H ]).
Basée sur l’hypothèse selon laquelle les nouvelles idées sont toujours influencées par les connaissances existantes, la diversification des sources de l’innovation indique si elle est plutôt “originale” ou “basique” (“the breadth of knowledge drawn upon by the invention”).32
31 Le terme d’ “Originalité” (Originality), dont la terminologie peut induire en erreur ici, est le terme originellement utilisé par Henderson et al. (1998) pour désigner cette variable.
32 Voir Degraff & Zilberman (2005)“The Division of Innovative Labor Among Universities, Entre-preneurs, and Corporations In agricultural biotechnology”, Working Paper University of California.
La valeur 0 indiquerait que le brevet ne cite qu’une seule classe (ou aucune) et est donc peu “Original” tandis que les valeurs proches de 1 indiquent des citations largement dispersées et donc une innovation plutôt “Originale”.
La variable utilisée dans les régressions est la valeur annuelle moyenne pour le portefeuille de brevets de la firme considérée.
Nous ajoutons aussi une mesure des externalités technologiques (technological spillovers) internes à la firme. Il s’agit de la propension que les firmes ont à citer des brevets qu’elles ont elles-mêmes déposés dans le passé.
Cette variable représente la part moyenne des auto-citations dans le portefeuille de brevets et elle est utilisée en moyennes annuelles (c’est à dire que lorsque 15% des citations qu’une firme fait une année t sont relatifs à des brevets qu’elle a elle-même déposé dans le passé, alors l’indice d’autocitations de cette firme sera de 0.15 pour cette même année t).
Comme le soulignent Hall et al. (2001) les auto-citations ont d’importantes implications pour l’étude des externalités technologiques.
Elles représentent des transferts de connaissances qui sont principalement internalisés par la firme, contrairement aux citations vers d’autres firmes qui sont plus proches de la notion d’externalités au sens pure.
On peut donc s’attendre à ce que cet indicateur rendent partiellement compte du rôle joué par les innovations précédemment faites par la firme. Hall et al. (2005) ont cependant souligné que les auto-citations doivent être interprétées prudemment.
En effet, elles peuvent représenter la construction de buissons de brevets (“patent thickets”) ou d’autres comportements qui sont moins pertinents en termes de valeur technologique que les citations provenant d’autres firmes.
D’un autre coté, ces auto-citations peuvent aussi mettre en évidence des mécanismes d’appropriation par la firme des externalités de ses propres inventions.
Les résultats de Hall et al. (2005) indiquent ainsi que, toutes choses égales par ailleurs, une forte part d’auto-citations implique une valeur de marché de la firme plus importante (ce qui peut néanmoins résulter de comportements stratégiques).
Plus précisément, le taux d’auto-citations aurait plus de valeur si la firme est de petite ou moyenne taille et serait neutre si la firme est importante. De plus ne pas en avoir (ne pas ou peu citer ses propres brevets) serait positif pour les firmes importantes et négatif pour les plus petites.33
33 B. Hall, présentation au WIPO-OECD Workshop on the Use of Patent Statistics with the support of the EPO, JPO and USPTO. 11-12 Octobre 2004, Genève.
Hall et al. (2001) soulignent enfin que par rapport à l’ensemble des brevets, pour les classes pharmaceutiques, le taux d’auto-citations est relativement élevé.
La figure II.2 montre par ailleurs que, dans notre échantillon, cette propension tend à augmenter et que parallèlement à l’augmentation de la propension qu’ont les firmes à s’auto-citer, la part des brevets “pionniers” sur l’ensemble des brevets déposés diminue.
FIG. II.2 – Auto-Citations et Part des Brevets Pionniers
Nous introduisons aussi des stocks actualisés d’innovation en suivant la procédure de l’inventaire perpétuel. Le stock est donc calculé avec un facteur de dépréciation de 15% par an de sorte que, sans dépôt additionnel, chaque année le portefeuille diminue de 15%.
Cette variable est importante parce qu’elle rend compte du stock de connaissances de la firme (au niveau des classes pharmaceutiques définies plus haut) : un stock élevé indique que la firme possède beaucoup de brevets et donc qu’elle dispose d’une base technologique interne importante.
Comme ce stock se déprécie continuellement dans le temps, seuls les brevets encore valides sont pris en compte dans le calcul.
En effet avec un taux de dépréciation annuel de 15% un brevet perd plus de 96% de sa valeur en vingt ans, le reste pouvant être admis comme étant de la valeur cognitive (par opposition à la valeur commerciale).
Le stock de brevets permet alors de capturer les effets propres aux connaissances récentes de la firme dans le processus d’innovation.
Dans une certaine mesure, une fois contrôlé pour la taille de l’entreprise, le stock de brevets indique s’il existe des effets d’apprentissage : si l’innovation est un processus dynamique et persistant dans le moyen/long terme alors cette variable doit être significative et positive pour expliquer les flux courants d’innovations de la firme.
Enfin, nous ajoutons comme variable de contrôle, la part des citations reçues par chaque firme vis-à-vis de l’ensemble des citations reçues chaque année.
Elle correspond au ratio du total des citations reçues une année donnée par une firme sur le total des citations reçues par l’ensemble de l’industrie cette même année. Cette variable doit alors capturer les effets que pourraient avoir la domination technologique d’une firme sur les autres.