Serveur Apache HTTP Version 2.2
Apache supporte la négociation de contenu telle qu'elle est décrite dans la spécification HTTP/1.1. Il peut choisir la meilleure représentation d'une ressource en fonction des préférences du navigateur pour ce qui concerne le type de media, les langages, le jeu de caractères et son encodage. Il implémente aussi quelques fonctionnalités pour traiter de manière plus intelligente les requêtes en provenance de navigateurs qui envoient des informations de négociation incomplètes.
La négociation de contenu est assurée par le module
mod_negotiation
qui est compilé par défaut
dans le serveur.
Une ressource peut être disponible selon différentes représentations. Par exemple, elle peut être disponible en différents langages ou pour différents types de média, ou une combinaison des deux. Pour faire le meilleur choix, on peut fournir à l'utilisateur une page d'index, et le laisser choisir. Cependant, le serveur peut souvent faire ce choix automatiquement. Ceci est possible car les navigateurs peuvent envoyer des informations sur les représentations qu'ils préfèrent à l'intérieur de chaque requête. Par exemple, un navigateur peut indiquer qu'il préfère voir les informations en français, mais qu'en cas d'impossibilité l'anglais peut convenir. Les navigateurs indiquent leurs préférences à l'aide d'en-têtes dans la requête. Pour ne demander que des représentations en français, le navigateur peut utiliser l'en-tête :
Accept-Language: fr
Notez qu'il ne sera tenu compte de cette préférence que s'il existe un choix de représentations et que ces dernières varient en fonction du langage.
À titre d'exemple d'une requête plus complexe, ce navigateur a été configuré pour accepter le français et l'anglais, avec une préférence pour le français, et accepter différents types de média, avec une préférence pour HTML par rapport au texte plat (plain text) ou autres types de fichiers texte, et avec une préférence pour GIF ou JPEG par rapport à tout autre type de média, mais autorisant tout autre type de média en dernier ressort :
Accept-Language: fr; q=1.0, en; q=0.5
Accept: text/html; q=1.0, text/*; q=0.8, image/gif; q=0.6, image/jpeg; q=0.6, image/*; q=0.5, */*; q=0.1
Apache supporte la négociation de contenu "server driven" (telle qu'elle
est définie dans la spécification HTTP/1.1), où c'est le serveur qui
décide quelle est la meilleure représentation à retourner pour la ressource
demandée. Il supporte entièrement les en-têtes de requête
Accept
, Accept-Language
,
Accept-Charset
et Accept-Encoding
.
Apache supporte aussi la négociation de contenu transparente, qui est un
protocole de négociation expérimental défini dans les RFC 2295 et 2296.
Il ne supporte pas la négociation de fonctionnalité (feature negotiation)
telle qu'elle est définie dans ces RFCs.
Une ressource est une entité conceptuelle identifiée par une URI (RFC 2396). Un serveur HTTP comme Apache propose l'accès à des représentations de la ressource à l'intérieur de son espace de nommage, chaque représentation étant composée d'une séquence d'octets avec la définition d'un type de media, d'un jeu de caractères, d'un encodage, etc... A un instant donné, chaque ressource peut être associée avec zéro, une ou plusieurs représentations. Si plusieurs représentations sont disponibles, la ressource est qualifiée de négociable et chacune de ses représentations se nomme variante. Les différences entre les variantes disponibles d'une ressource négociable constituent les dimensions de la négociation.
Afin de négocier une ressource, on doit fournir au serveur des informations à propos de chacune des variantes. Il y a deux manières d'accomplir ceci :
*.var
) qui nomme explicitement les fichiers
contenant les variantes, ouUne liste de correspondances de types est un document associé au
gestionnaire type-map
(ou, dans un souci de compatibilité
ascendante avec des configurations d'Apache plus anciennes, le
type MIME
application/x-type-map
). Notez que pour utiliser cette
fonctionnalité, vous devez, dans le fichier de configuration, définir un
gestionnaire qui associe un suffixe de fichier à une type-map
;
ce qui se fait simplement en ajoutant
AddHandler type-map .var
dans le fichier de configuration du serveur.
Les fichiers de correspondances de types doivent posséder le même nom que
la ressource qu'ils décrivent, et comporter une entrée pour chaque variante
disponible; chaque entrée consiste en une ligne contiguë d'en-têtes au
format HTTP. les entrées sont séparées par des lignes vides. Les lignes
vides à l'intérieur d'une entrée sont interdites. Par convention, le
fichier de correspondances débute par une entrée concernant l'entité
considérée dans son ensemble (bien que ce ne soit pas obligatoire, et
ignoré si présent). Un exemple de fichier de correspondance est fourni
ci-dessous.
Ce fichier doit être nommé foo.var
, car il décrit une
ressource nommée foo
.
URI: foo
URI: foo.en.html
Content-type: text/html
Content-language: en
URI: foo.fr.de.html
Content-type: text/html;charset=iso-8859-2
Content-language: fr, de
Notez aussi qu'un fichier de correspondances de types prend le pas sur les extensions de noms de fichiers, même si les Multivues sont activées. Si les variantes sont de qualités différentes, on doit l'indiquer à l'aide du paramètre "qs" à la suite du type de média, comme pour cette image (disponible aux formats JPEG, GIF, ou ASCII-art) :
URI: foo
URI: foo.jpeg
Content-type: image/jpeg; qs=0.8
URI: foo.gif
Content-type: image/gif; qs=0.5
URI: foo.txt
Content-type: text/plain; qs=0.01
Les valeurs de qs peuvent varier de 0.000 à 1.000. Notez que toute variante possédant une valeur de qs de 0.000 ne sera jamais choisie. Les variantes qui n'ont pas de paramètre qs défini se voient attribuer une valeur de 1.0. Le paramètre qs indique la qualité relative de la variante comparée à celle des autres variantes disponibles, sans tenir compte des capacités du client. Par exemple, un fichier JPEG possède en général une qualité supérieure à celle d'un fichier ASCII s'il représente une photographie. Cependant, si la ressource représentée est à un ASCII art original, la représentation ASCII sera de meilleure qualité que la représentation JPEG. Ainsi une valeur de qs est associée à une variante en fonction de la nature de la ressource qu'elle représente.
La liste complète des en-têtes reconnus est disponible dans la documentation de la directive typemap (module mod_negotiation).
MultiViews
est une option qui s'applique à un répertoire,
ce qui signifie qu'elle peut être activée à l'aide d'une directive
Options
à l'intérieur d'une section
<Directory>
, <Location>
ou <Files>
dans
httpd.conf
, ou (si AllowOverride
est correctement positionnée) dans
des fichiers
.htaccess
. Notez que Options All
n'active pas MultiViews
; vous devez activer cette option en
la nommant explicitement.
L'effet de MultiViews
est le suivant : si le serveur reçoit
une requête pour /tel/répertoire/foo
, si
MultiViews
est activée pour
/tel/répertoire
, et si
/tel/répertoire/foo
n'existe pas, le serveur parcourt
le répertoire à la recherche de fichiers nommés foo.*, et génère
une correspondance de types (type map) qui liste tous ces
fichiers, en leur associant les mêmes types de média et encodages de
contenu qu'ils auraient eu si le client avait demandé l'accès à l'un
d'entre eux par son nom. Il choisit ensuite ce qui correspond le mieux
aux besoins du client.
MultiViews
peut aussi s'appliquer à la recherche du fichier
nommé par la directive DirectoryIndex
, si le serveur tente d'indexer
un répertoire. Si les fichiers de configuration spécifient
DirectoryIndex index
le serveur va choisir entre index.html
et index.html3
si les deux fichiers sont présents. Si aucun
n'est présent, mais index.cgi
existe,
le serveur l'exécutera.
Si, parcequ'elle n'est pas reconnue par mod_mime
,
l'extension d'un des fichiers du répertoire ne permet pas de
déterminer son jeu de caractères, son type de contenu, son langage, ou son
encodage, alors
le résultat dépendra de la définition de la directive MultiViewsMatch
. Cette directive détermine
si les gestionnaires (handlers), les filtres, et autres types d'extensions
peuvent participer à la négociation MultiVues.
Une fois obtenue la liste des variantes pour une ressource donnée, Apache dispose de deux méthodes pour choisir la meilleure variante à retourner, s'il y a lieu, soit à partir d'un fichier de correspondances de types, soit en se basant sur les noms de fichiers du répertoire. Il n'est pas nécessaire de connaître en détails comment la négociation fonctionne réellement pour pouvoir utiliser les fonctionnalités de négociation de contenu d'Apache. La suite de ce document explique cependant les méthodes utilisées pour ceux ou celles qui sont intéressés(ées).
Il existe deux méthodes de négociation :
Dimension | Notes |
---|---|
Type de média | Le navigateur affiche ses préférences à l'aide du champ d'en-tête
Accept . Chaque type de média peut se voir associé un facteur de
qualité. La description de la variante peut aussi avoir un facteur de
qualité (le paramètre "qs"). |
Langage | Le navigateur affiche ses préférences à l'aide du champ d'en-tête
Accept-Language . Chaque langue peut se voir associée un facteur de
qualité. Les variantes peuvent être associées avec zéro, un ou
plusieurs langages. |
Encoding | Le navigateur affiche ses préférences à l'aide du champ d'en-tête
Accept-Encoding . Chaque encodage peut se voir associé un facteur de
qualité. |
Charset | Le navigateur affiche ses préférences à l'aide du champ d'en-tête
Accept-Charset . Chaque jeu de caractères peut se voir associé un facteur de
qualité. Les variantes peuvent préciser un jeu de caractères comme
paramètre du type de média. |
Apache peut utiliser l'algorithme suivant pour choisir la "meilleure" variante (s'il y en a une) à retourner au navigateur. Cet algorithme n'est pas configurable. Il fonctionne comme suit :
Accept
par le facteur de qualité "qs" pour le type de
média de ces variantes, et choisir la variante qui possède la valeur
la plus importante.Accept-Language
(s'il existe), ou de la directive
LanguagePriority
(si elle existe).Accept-Charset
. Le jeu de
caractères ISO-8859-1 est acceptable sauf s'il est explicitement
exclus. Les variantes avec un type de média text/*
mais non explicitement associées avec un jeu de caractères
particulier sont supposées être en ISO-8859-1.Vary
de la réponse est renseigné de façon à
indiquer les dimensions de la négociation (les navigateurs et les caches
peuvent utiliser cette information lors de la mise en cache de la
ressource). Travail terminé.Vary
de façon à indiquer les dimensions de la variante.Parfois Apache modifie les valeurs de qualité par rapport à celles qui
découleraient d'une stricte interprétation de l'algorithme de négociation
d'Apache ci-dessus, ceci pour améliorer les résultats de l'algorithme pour
les navigateurs qui envoient des informations incomplètes ou inappropriées.
Certains des navigateurs les plus populaires envoient des informations dans
l'en-tête Accept
qui, sans ce traitement, provoqueraient la
sélection d'une variante inappropriée dans de nombreux cas. Quand un
navigateur envoie des informations complètes et correctes ces ajustements
ne sont pas effectués.
L'en-tête de requête Accept:
indique les types de média
souhaités. Il peut aussi contenir des types de média avec caractères
génériques, comme "image/*" ou "*/*" où * correspond à n'importe quelle
chaîne de caractères. Ainsi une requête contenant :
Accept: image/*, */*
indiquerait que tout type de média est acceptable, avec une préférence pour les types commençant par "image/". Certains navigateurs ajoutent par défaut des types de média avec caractères génériques aux types explicitement nommés qu'ils peuvent gérer. Par exemple :
Accept: text/html, text/plain, image/gif, image/jpeg, */*
Ceci indique que les types explicitement listés sont préférés, mais qu'une représentation avec un type différent de ces derniers conviendra aussi. Les valeurs de qualités explicites, afin de préciser ce que veut vraiment le navigateur, s'utilisent comme suit :
Accept: text/html, text/plain, image/gif, image/jpeg, */*; q=0.01
Les types explicites n'ont pas de facteur de qualité, la valeur par défaut de leur préférence est donc de 1.0 (la plus haute). Le type avec caractères génériques */* se voit attribuer une préférence basse de 0.01, si bien que les types autres que ceux explicitement listés ne seront retournés que s'il n'existe pas de variante correspondant à un type explicitement listé.
Si l'en-tête Accept:
ne contient pas aucun
facteur de qualité, Apache positionne la valeur de qualité de
"*/*", si present, à 0.01 pour simuler l'effet désiré. Il positionne aussi
la valeur de qualité des types avec caractères génériques au format
"type/*" à 0.02 (ils sont donc préférés à ceux correspondant à "*/*"). Si
un type de média dans l'en-tête Accept:
contient un facteur de
qualité, ces valeurs spéciales ne seront pas appliquées, de façon
à ce que les requêtes de navigateurs qui envoient les informations
explicites à prendre en compte fonctionnent comme souhaité.
A partir de la version 2.0 d'Apache, certaines exceptions ont été ajoutées à l'algorithme de négociation afin de ménager une issue de secours quand la négociation ne trouve aucun langage correspondant.
Quand un client demande une page sur votre serveur, si ce dernier ne
parvient pas à trouver une page dont la langue corresponde à l'en-tête
Accept-language
envoyé par le navigateur, il enverra au client
une réponse "Aucune variante acceptable" ou "Plusieurs choix possibles".
Pour éviter ces
messages d'erreur, il est possible de configurer Apache de façon à ce que,
dans ces cas, il ignore l'en-tête Accept-language
et fournisse
tout de même un document, même s'il ne correspond pas exactement à la
demande explicite du client. La directive ForceLanguagePriority
peut être utilisée pour éviter ces messages d'erreur et leur substituer une
page dont le langage sera déterminé en fonction du contenu de la directive
LanguagePriority
.
Le serveur va aussi essayer d'étendre sa recherche de correspondance aux
sous-ensembles de langages quand aucune correspondance exacte ne peut être
trouvée. Par exemple, si un client demande des documents possédant le
langage en-GB
, c'est à dire anglais britannique, le standard
HTTP/1.1 n'autorise normalement pas le serveur à faire correspondre cette
demande à un document dont le langage est simplement en
.
(Notez qu'inclure en-GB
et non en
dans l'en-tête
Accept-Language
constitue une quasi-erreur de configuration,
car il est très peu probable qu'un lecteur qui comprend l'anglais
britannique, ne comprenne pas l'anglais en général. Malheureusement, de
nombreux clients ont réellement des configurations par défaut de ce type.)
Cependant, si aucune autre correspondance de langage n'est possible, et que le
serveur est sur le point de retourner une erreur "Aucune variable
acceptable" ou de choisir le langage défini par la directive LanguagePriority
, le serveur ignorera
la spécification du sous-ensemble de langage et associera la demande en
en-GB
à des documents en en
. Implicitement,
Apache ajoute le langage parent à la liste de langues acceptées par le
client avec une valeur de qualité très basse. Notez cependant que si le
client demande "en-GB; q=0.9, fr; q=0.8", et le serveur dispose de
documents estampillés "en" et "fr", alors c'est le document "fr" qui sera
retourné, tout ceci dans un souci de compatibilité avec la spécification
HTTP/1.1 et afin de fonctionner efficacement avec les clients
correctement configurés.
Pour supporter les techniques avancées (comme les cookies ou les chemins
d'URL spéciaux) afin de déterminer le langage préféré de l'utilisateur, le
module mod_negotiation
reconnaît la
variable d'environnement
prefer-language
depuis la version 2.0.47 d'Apache. Si elle est définie et contient un
symbole de langage approprié, mod_negotiation
va essayer
de sélectionner une variante correspondante. S'il n'existe pas de telle
variante, le processus normal de négociation sera lancé.
SetEnvIf Cookie "language=(.+)" prefer-language=$1
Header append Vary cookie
Apache étend le protocole de négociation de contenu transparente (RFC
2295) comme suit. Un nouvel élément {encodage ..}
est utilisé dans
les listes de variantes pour marquer celles qui ne sont disponibles qu'avec un
encodage de contenu spécifique. L'implémentation de l'algorithme
RVSA/1.0 (RFC 2296) est étendue à la reconnaissance de variantes encodées dans
la liste, et à leur utilisation en tant que variantes candidates à partir du
moment où leur encodage satisfait au contenu de l'en-tête de requête
Accept-Encoding
. L'implémentation RVSA/1.0 n'arrondit pas les
facteurs de qualité calculés à 5 décimales avant d'avoir choisi la meilleure
variante.
Si vous utilisez la négociation de langage, vous avez le choix entre différentes conventions de nommage, car les fichiers peuvent posséder plusieurs extensions, et l'ordre dans lequel ces dernières apparaissent est en général sans rapport (voir la documentation sur le module mod_mime pour plus de détails).
Un fichier type possède une extension liée au type MIME
(par exemple, html
), mais parfois aussi une
extension liée à l'encodage (par exemple, gz
),
et bien sûr une extension liée au langage
(par exemple, en
) quand plusieurs variantes de
langage sont disponibles pour ce fichier.
Exemples :
Ci-dessous d'autres exemples de noms de fichiers avec des liens hypertextes valides et invalides :
Nom fichier | lien valide | Lien invalide |
---|---|---|
foo.html.en | foo foo.html |
- |
foo.en.html | foo | foo.html |
foo.html.en.gz | foo foo.html |
foo.gz foo.html.gz |
foo.en.html.gz | foo | foo.html foo.html.gz foo.gz |
foo.gz.html.en | foo foo.gz foo.gz.html |
foo.html |
foo.html.gz.en | foo foo.html foo.html.gz |
foo.gz |
En regardant la table ci-dessus, vous remarquerez qu'il est toujours
possible d'utiliser le nom de fichier sans extension dans un lien
(par exemple, foo
). L'avantage est de pouvoir
dissimuler le type réel du fichier associé à un document et de pouvoir
le modifier
ultérieurement, par exemple, de html
à
shtml
ou cgi
sans avoir à
mettre à jour aucun lien.
Si vous souhaitez continuer à utiliser un type MIME dans vos liens
(par exemple foo.html
), l'extension liée au langage
(y compris une extension liée à l'encodage s'il en existe une)
doit se trouver à droite de l'extension liée au type MIME
(par exemple, foo.html.en
).
Quand un cache stocke une représentation, il l'associe avec l'URL de la requête. Lorsque cette URL est à nouveau demandée, le cache peut utiliser la représentation stockée. Cependant, si la ressource est négociable au niveau du serveur, il se peut que seule la première variante demandée soit mise en cache et de ce fait, la correspondance positive du cache peut entraîner une réponse inappropriée. Pour éviter ceci, Apache marque par défaut toutes les réponses qui sont retournées après une négociation de contenu comme "non-cachables" par les clients HTTP/1.0. Apache supporte aussi les fonctionnalités du protocole HTTP/1.1 afin de permettre la mise en cache des réponses négociées.
Pour les requêtes en provenance d'un client compatible HTTP/1.0
(un navigateur ou un cache), la directive CacheNegotiatedDocs
peut être utilisée
pour permettre la mise en cache des réponses qui ont fait l'objet d'une
négociation. Cette directive peut intervenir dans la configuration au
niveau du serveur ou de l'hôte virtuel, et n'accepte aucun argument. Elle
n'a aucun effet sur les requêtes en provenance de clients HTTP/1.1.
Pour les clients HTTP/1.1, Apache envoie un en-tête de réponse HTTP
Vary
afin d'indiquer les dimensions de la négociation pour
cette réponse. Les caches peuvent
utiliser cette information afin de déterminer
si une requête peut être servie à partir de la copie locale. Pour inciter
un cache à utiliser la copie locale sans tenir compte des dimensions de la
négociation, définissez la
variable d'environnement
force-no-vary
.
Pour plus d'informations à propos de la négociation de contenu, voir le document d'Alan J. Flavell Language Negotiation Notes. Mais gardez à l'esprit que ce document ne tiendra peut-être pas compte des changements intervenus dans Apache 2.0.