Cover Image

# Généralités

  • Le Web ( Toile ou réseau) désigne le système donnant accès à un ensemble de données (pages, images, son, vidéo) reliées par des liens hytpertextes et accessibles sur le réseau internet.

  • Sur le Web, les contenus sont exprimés et assemblés dans divers formats normalisés par le consorstium mondial W3C (opens new window) (World Wild Web Consortium) qui permet une circulation standartisée de ces informations.

    Le Web n'est qu'une application d'Internet comme le courier électronique, la messagerie instantanée, le partage de fichiers, les jeux en ligne, etc...

  • Quand on parle du Web, on pense généralement à la partie visible, indexée par les moteurs de recherche. Pourtant, il existe une partie invisible, que l'on appelle Deep Web (Web profond). Il comprend toutes les pages qui ne sont pas accessibles par les moteurs de recherches classiques. Elles peuvent être de tout les types, mais ce sont le plus souvent des bases de données, des bibliothèques en ligne ou encore des sites protégées par un mot de passe.

    Le Dark Web est une partie du Deep Web

Info

Le Web invisible est difficilement quantifiable, mais on estime qu'il est plusieurs centaines de fois plus grand que le Web indexé.

# Les pages Web HTML

Une page Web est accessible via un navigateur Web (Mozilla Firefox, Google Chrome, Safari, etc...). Elle dispose d'une adresse Web unique, nommée URL (Uniform Ressource Locator), à saisir directement dans la barre d'adresse de ces navigateurs.

Elle peut aussi être retrouvée via un moteur de recherche, ou encore en suivant un mien hypertexte présent sur le site ou un autre site Web.

Les pages Web sont écrites dans le langage de balises HTML (Hypertex Markup Language). Leur style graphique est défini dans le langage CSS (Cascading Style Sheets).

Elle sont accessibles via internet en utilisant le protocole HTTP (Hypertext Transfert Protocol) ou sa version sécurisée HTTPS qui crypte les échanges.

# Les requêtes HTTP

Pour surfer sur le Web, l'internaute utilise un navigateur internet. En fonction de ses lics ou de ses saisies, le navigateur va appeler des pages contenues sur des serveurs, les récupérer et les afficher. Le serveur attend les connexions et les demandes, et répond en envoyant du contenu.

Le but du protocole HTTP est de permettre un transfert de fichiers entre un navigateur (le client) et un serveur Web.

C'est un protocole de communication client-serveur qui fonctionne sur le principe requête-réponse.