Réalisation de télescopes à rayons X – de la conception aux performances
La physique de la réflexion par incidence rasante
Une façon de focaliser et d’imager des sources de lumière est d’utiliser des surfaces courbes réfléchissantes. L’interaction de la lumière avec la matière peut être décrite par l’indice de réfraction complexe qui décrit le changement des propriétés de l’onde électromagnétique incidente lorsqu’elle traverse la frontière entre les deux matériaux concernés. L’indice n se lit :
δ décrit le changement de phase et β rend compte de l’absorption. Les coefficients de réflexion pour les polarisations p et s sont donnés par les équations de Fresnel :
E r /E i désigne le rapport des amplitudes des champs électriques réfléchi et incident et α est l’angle d’incidence rasant tel que mesuré à partir du plan d’interface. Pour une incidence normale, qui est la norme dans les télescopes optiques, α ≈ 90°. Cette approche est, en général, correcte tant que les hypothèses d’application des équations de Fresnel sont remplies. L’intensité réfléchie ou réflectivité est alors R\(\sb{\rm p} = \mbox{r}\sb{\rm p}\times~r\sb{\rm p}\sp{*}\) et R\(\sb{\rm s} = \mbox{r} \sb{\rm s}\sp{*}\), où l’astérisque désigne la valeur complexe conjuguée.
Les composantes de l’indice de réfraction pour une transition de matière sous vide sont souvent appelées les constantes optiques du matériau. Dans la gamme des longueurs d’onde optiques, par exemple, la partie réelle de l’indice de réfraction est supérieure à un, mais avec la diminution de la longueur d’onde, elle devient inférieure à un, ce qui change radicalement l’interaction de la lumière avec la matière. La réflectivité de la surface à incidence normale diminue rapidement et les miroirs perdent leur efficacité à partir de la bande de longueur d’onde UV. Cependant, si l’on applique la loi de Snell à la lumière incidente et réfractée, il s’avère que l’angle de réfraction mesuré à partir de la normale à la surface est supérieur à 90° pour n\(\sb{\rm r}~=~1~-~\delta~<~1\), ou que la réflexion externe totale se produit pour des angles d’incidence rasante \(\alpha~\le~\alpha\sb{\rm t}\) :
ou pour δ ≪ 1:
Pour les applications réelles, un compromis doit être fait en termes de surface collectrice effective entre la conception d’un télescope à incidence normale et celle d’un télécopieur à incidence rasante. La surface collectrice effective est le produit de la réflectivité en fonction de la longueur d’onde par la surface géométrique du miroir primaire projetée sur l’ouverture frontale. En fonction du nombre d’éléments optiques réfléchissants impliqués, les télescopes à incidence rasante ont tendance à être plus efficaces pour les longueurs d’onde inférieures à environ 30 nm. De plus, la réflectivité en incidence normale diminue si rapidement avec la longueur d’onde que pour les observations à des longueurs d’onde inférieures à environ 15 nm, l’incidence rasante est le seul choix possible. Cette limite peut être quelque peu étendue à des longueurs d’onde encore plus courtes par l’utilisation de revêtements multicouches du miroir, mais seulement sur une bande de longueur d’onde assez restreinte. Des revêtements multicouches de plusieurs centaines de bicouches, chacune d’une épaisseur de quelques Ångstro̊m, peuvent également être appliqués aux miroirs à incidence rasante, étendant ainsi la gamme d’énergie des photons à environ 100 keV.
L’indice de réfraction ou les constantes optiques peuvent être calculés à partir de la théorie de la dispersion anormale. Pour des longueurs d’onde λ ou des énergies de photons suffisamment décalées de toute énergie de liaison des électrons, une estimation grossière de δ peut être faite :
où N0 est le nombre d’Avogadro, re est le rayon classique des électrons, Z et A sont le numéro atomique et le poids, respectivement, et ρ est la densité de masse. Pour les éléments lourds pour lesquels Z/A≈0,5, l’angle d’incidence de la réflexion totale pour δ ≪1 peut être estimé à :
avec \(\rm{\alpha\sb t}\) en arcmin, λ en Å et ρ en g/cm3. Pour les rayons X, avec λ de quelques Å, \(\rm{\alpha\sb t}\) est d’environ un degré. L’équation (7) suggère que les matériaux les plus denses sont les revêtements réfléchissants tels que l’or, le platine ou l’iridium, qui ont tous été utilisés pour les miroirs des télescopes spatiaux à rayons X. Cependant, ces matériaux montrent une forte tendance à l’augmentation de la température. Cependant, ces matériaux présentent une réduction prononcée de la réflectivité aux énergies comprises entre 2 keV et 4 keV en raison de la présence de l’absorption de l’enveloppe M, de sorte que le nickel, par exemple, malgré sa densité plus faible a parfois été préféré, en particulier, pour les observations en dessous de 4 keV.
Les constantes optiques sont liées aux facteurs de diffusion atomique, dont les tables les plus à jour ont été compilées par le Center for X-ray Optics (http://henke.lbl.gov/optical constants/, ). Ces tables couvrent la gamme d’énergie de 50 eV à 30 keV pour les éléments avec Z = 1-92, et constituent une base de données très utile pour concevoir des optiques à incidence rasante.
Configurations de télescopes à incidence rasante
En incidence rasante, l’imagerie d’une source étendue ou l’imagerie sur un certain champ étendu nécessite au moins deux réflexions, c’est-à-dire deux surfaces réfléchissantes. Les miroirs simples comme les paraboles à incidence rasante souffrent d’une forte coma, empêchant une véritable imagerie. Cependant, un tel miroir peut encore focaliser, et les paraboles ont été utilisées comme « seaux à lumière ».
Il existe trois configurations différentes de systèmes à deux miroirs, qui sont les systèmes de type Wolter, les systèmes de type Kirkpatrick-Baez, et les systèmes à collimateur de focalisation ou « œil de homard ».
Télescopes de Wolter
En 1952, Hans Wolter a suggéré trois types différents de télescopes imageurs pour l’incidence rasante, qui sont devenus connus sous le nom de télescopes de Wolter de type I, type II et type III . Les surfaces utilisées englobent un paraboloïde, un hyperboloïde et un ellipsoïde. Les types I et II utilisent un paraboloïde et un hyperboloïde, le type III combine un miroir paraboloïde et un ellipsoïde. Dans chaque cas, les deux miroirs concernés sont disposés de manière coaxiale et confocale. La principale différence entre les trois types est le rapport entre la distance focale et la longueur totale du système, c’est-à-dire la longueur physique minimale du télescope.
La distance focale d’un système de type I (figure 1) est pratiquement donnée par la distance entre le plan d’intersection paraboloïde/hyperboloïde (Knickfläche) et le foyer du système. Par conséquent, la longueur physique du télescope dépasse toujours la longueur focale de la longueur du paraboloïde. Ce système a été principalement utilisé pour les observations spatiales en raison de sa compacité, de sa configuration simple en ce qui concerne l’interface avec la structure de montage, et parce qu’il offre un espace libre pour ajouter facilement d’autres télescopes à l’intérieur et à l’extérieur. Ces télescopes à composants multiples sont appelés systèmes imbriqués. Ils augmentent considérablement la surface collectrice.
Les systèmes simples de type I ont été utilisés pour les observations de rayons X solaires alors que pour les observations astronomiques EUV et rayons X, pour lesquelles la zone de collecte est de la plus haute importance, des systèmes imbriqués ont été utilisés (l’observatoire EINSTEIN et , EXOSAT , ROSAT , ASCA & et Suzaku , les observatoires Chandra et et XMM-Newton, ainsi que les télescopes JET-X de la mission SWIFT et ). Par exemple, chacun des trois télescopes à rayons X embarqués à bord de XMM-Newton accueille 58 paires de coquilles de miroirs Wolter de type I imbriqués paraboloïde-hyperboloïde.
Le système Wolter de type II (figure 1) est un véritable système télescopique, pour lequel la distance focale peut être beaucoup plus longue que la longueur physique du télescope. Ces systèmes sont utiles pour alimenter les spectromètres qui nécessitent une grande dispersion.
Le nombre f est un nombre important pour les télescopes optiques lors de l’imagerie d’objets étendus. Plus le nombre f est faible, plus la luminosité de l’image est élevée. De même, des nombres f peuvent être définis pour les télescopes à rayons X, qui peuvent être calculés en utilisant (1)-(7). Il s’avère que le nombre f est inversement proportionnel à l’angle de réflexion totale qui, à son tour, diminue linéairement avec l’augmentation de l’énergie des photons. Par conséquent, les télescopes optimisés pour le régime à basse énergie (<2 keV) sont assez rapides et devraient utiliser la conception de type I de Wolter. Le nombre f effectif minimum du télescope ROSAT était de 9. Les télescopes destinés à l’observation efficace des photons de haute énergie jusqu’à 10 keV ont nécessairement des nombres f beaucoup plus grands (environ 75 pour XMM-Newton ou 40 pour Chandra), selon l’importance accordée aux hautes énergies. Les télescopes de type II doivent être utilisés si une très longue distance focale est nécessaire par rapport à la longueur du télescope, car la « Knickfläche » de Wolter (voir Fig. 1) peut facilement être positionnée loin devant le plan d’entrée du miroir primaire. Même dans le domaine des rayons X très mous, des nombres f inférieurs à 50 (par exemple, le télescope CDS de l’observatoire solaire SOHO) ne peuvent être obtenus.
En raison de l’interdépendance intime entre le nombre f, l’angle rasant, le diamètre du télescope et la distance focale, les télescopes de grand diamètre travaillant à des énergies élevées ne peuvent être construits qu’avec de longues distances focales appropriées, et comme le repliement du faisceau de rayons X est inacceptable en raison des pertes par réflexion importantes, la distance entre le module miroir et le plan focal devient substantielle. C’est ainsi qu’est née l’idée de faire voler en formation spatiale deux vaisseaux spatiaux, l’un portant le télescope et l’autre, loin derrière, abritant les instruments du plan focal. Si la séparation n’est pas trop grande, un banc optique extensible pourrait combler la distance.
Les systèmes de type Wolter sont exempts d’aberration sphérique, mais souffrent toujours d’aberration de coma, d’astigmatisme et de courbure de champ. Dans un second article, Wolter a présenté les équations des télescopes à incidence rasante qui obéissent exactement à la condition du sinus d’Abbe, éliminant complètement la coma. Ceci est obtenu par de très petites corrections (sub-μm à un μm) du profil axial du miroir par rapport à sa forme nominale de second ordre. La forme exacte de la surface a été dérivée par Wolter en étendant les solutions à l’incidence rasante que Karl Schwarzschild avait déjà obtenues pour l’incidence normale en 1905. Ces systèmes sont donc appelés télescopes Wolter-Schwarzschild. Ils surpassent les systèmes de Wolter en termes de performances d’imagerie hors axe s’ils sont utilisés à de plus grandes longueurs d’onde, c’est-à-dire dans la bande EUV et dans la bande des rayons X mous. Les télescopes Wolter-Schwarzschild de type I ont été utilisés sur les télescopes EUV-Explorer et ROSAT-WFC . Un système Wolter-Schwarzschild de type II alimentait le télescope spectroscopique de l’EUV-Explorer, et le télescope CDS à bord de la mission solaire SOHO est de type Wolter-Schwarzschild II.
Le degré maximal d’imbrication, et donc le débit le plus élevé par rapport à la surface de l’ouverture d’entrée, est obtenu avec des miroirs aussi fins que possible. Des centaines de feuilles minces ou de feuilles représentant les miroirs constituent les télescopes utilisés dans les missions ASCA et Suzaku. La forme parabolique/hyperbolique des miroirs de type I de Wolter est approximée par des cônes droits. L’image parfaite d’une source ponctuelle sur l’axe est perdue mais la capacité d’imagerie est préservée. L’approximation par des cônes de la configuration de Wolter de type I a également été utilisée pour les télescopes à rayons X BeppoSax & (figures 2, 3, 4, 5 et 6).
Télescopes Kirkpatrick-Baez
La première image bidimensionnelle de rayons X jamais obtenue par réflexion en incidence rasante a été prise en laboratoire par Kirkpatrick et Baez . Les rayons incidents sont focalisés sur une image linéaire par un miroir parabolique. Sur leur chemin vers le foyer linéaire, les rayons sont réfléchis par un second miroir parabolique jusqu’au foyer ponctuel pour les rayons parallèles aux lignes centrales des paraboles. Les plans de surface des deux miroirs sont orientés à 90° l’un par rapport à l’autre. Afin d’augmenter la surface collectrice (la surface frontale), on peut construire une pile de paraboles de translation. Cependant, contrairement au système à une seule plaque double, l’image d’une source ponctuelle commence à devenir de plus en plus étendue en taille au fur et à mesure que le nombre de plaques impliquées augmente. Les télescopes Wolter de type I courbent la direction du rayon incident deux fois dans le même plan, alors que les deux courbures dans les systèmes Kirkpatrick-Baez se produisent dans deux plans orthogonaux, ce qui, pour le même angle d’incidence sur le miroir primaire, nécessite un télescope plus long.
Un télescope de Kirkpatrick-Baez n’a jamais volé sur une mission satellite, mais une modification utilisant des plaques plates au lieu de paraboles, fournissant toujours une imagerie bidimensionnelle, a fonctionné avec succès sur des vols de fusées-sondes fournissant des mesures positives d’étoiles ordinaires et d’amas de galaxies .
Télescopes à collimateur de focalisation ou « œil de homard »
Les systèmes Wolter et Kirkpatrick-Baez ont en commun un champ de vision relativement étroit qui est pratiquement limité à l’angle rasant employé sur les miroirs individuels. Schmidt et Angel ont proposé des systèmes d’imagerie offrant un champ de vision beaucoup plus large, mais avec une résolution angulaire sur l’axe systématiquement réduite. De tels systèmes seraient idéaux pour un moniteur d’imagerie à grand champ.
La disposition principale du concept de Schmidt fait appel à deux empilements de miroirs plans, qui sont disposés en un empilement supérieur et un empilement inférieur et orientés orthogonalement l’un par rapport à l’autre. Les miroirs de chaque pile sont disposés de telle sorte que leurs lignes centrales inscrivent un cylindre, où les deux cylindres associés à la pile sont à angle droit l’un par rapport à l’autre et le croisement de leurs lignes centrales est à l’origine du système de coordonnées. Un foyer est formé à mi-chemin entre les miroirs et l’origine du système de coordonnées. Les deux faces d’une lame de miroir, c’est-à-dire la face avant et la face arrière, réfléchissent les rayons X. La mise au point n’est pas parfaite à cause de l’influence de l’angle de la lame de miroir. La focalisation n’est pas parfaite en raison de la hauteur finie des lames de miroir. Avec un tel dispositif, un hémisphère complet du ciel pourrait être observé simultanément.
Une variante de cette conception, qui fournit une imagerie bidimensionnelle, a été présentée par Angel (voir aussi et les références à ce sujet). Le dispositif est composé de nombreux petits tubes à côtés carrés avec des surfaces réfléchissantes. Les tubes sont basés et répartis sur la surface d’une sphère. L’axe de chaque tube suit un rayon vecteur de la sphère. Après qu’un rayon ait été réfléchi deux fois à l’intérieur d’un tube mais par des parois adjacentes, une image bidimensionnelle est formée. La surface focale est une sphère dont le rayon est égal à la moitié de celui de la sphère portant les tubes. Ce type d’optique à incidence rasante est effectivement réalisé dans les yeux réfléchissants des homards et des crevettes, d’où le nom de ce type particulier de télescope à rayons X. Le principe optique est très similaire au collimateur de focalisation de Schmidt lors du décalage et de la fusion des empilements de miroirs supérieurs et inférieurs du dispositif de Schmidt en une seule section formant des tubes à côtés carrés.
Dans la conception de Schmidt comme dans celle d’Angel, il existe des rayons traversant l’optique avec une seule réflexion ou aucune. Ils apparaissent comme un fond diffus ou linéaire de luminosité non négligeable. En soi, l’imagerie n’est pas parfaite et, en fin de compte, la résolution angulaire d’un tel dispositif est limitée par la largeur d’un seul tube vue par le détecteur, et à la résolution d’une seconde d’arc, la diffraction imposée par la largeur du tube doit être prise en compte, ce qui favorise un tel système pour l’observation des rayons X durs. Un tel télescope aurait un grand potentiel pour la surveillance continue des rayons X de grands champs du ciel.
Des prototypes ont été construits et réalisés en République tchèque par le groupe de Hudec et al. .