hgbook

view fr/intro.tex @ 960:e3913a4b5b26

Fixing leftovers stuff from last merge with Wilkk
author Romain PELISSE <belaran@gmail.com>
date Tue Feb 24 00:03:10 2009 +0100 (2009-02-24)
parents f2cd9743c473
children
line source
1 \chapter{Introduction}
2 \label{chap:intro}
4 \section{À propos de la gestion source}
6 La gestion de sources est un processus permettant de gérer différentes
7 versions de la même information. Dans sa forme la plus simple, c'est
8 ce que tout le monde fait manuellement : quand vous modifiez
9 un fichier, vous le sauvegardez sous un nouveau nom contenant un numéro,
10 à chaque fois plus grand que celui de la version précédente.
12 Ce genre de gestion de version manuelle est cependant facilement sujette
13 à des erreurs, ainsi, depuis longtemps, des logiciels existent pour
14 résoudre cette problématique. Les premiers outils de gestion de sources
15 étaient destinés à aider un seul utilisateur, à automatiser la gestion
16 des versions d'un seul fichier. Dans les dernières décades, cette cible
17 s'est largement agrandie, ils gèrent désormais de multiples fichiers, et
18 aident un grand nombre de personnes à travailler ensemble. Les outils les
19 plus modernes n'ont aucune difficulté à gérer plusieurs milliers de
20 personnes travaillant ensemble sur des projets regroupant plusieurs
21 centaines de milliers de fichiers.
23 \subsection{Pourquoi utiliser un gestionnaire de source ?}
25 Il y a de nombreuses raisons pour que vous ou votre équipe souhaitiez
26 utiliser un outil automatisant la gestion de version pour votre projet.
27 \begin{itemize}
28 \item L'outil se chargera de suivre l'évolution de votre projet, sans
29 que vous n'ayez à le faire. Pour chaque modification, vous aurez à votre
30 disposition un journal indiquant \emph{qui} a fait quoi, \emph{pourquoi}
31 ils l'ont fait, \emph{quand} ils l'ont fait, et \emph{ce} qu'ils ont
32 modifiés.
33 \item Quand vous travaillez avec d'autres personnes, les logiciels de
34 gestion de source facilitent le travail collaboratif. Par exemple, quand
35 plusieurs personnes font, plus ou moins simultanément, des modifications
36 incompatibles, le logiciel vous aidera à identifier et à résoudre les conflits.
37 \item L'outil vous aidera à réparer vos erreurs. Si vous effectuez un changement
38 qui se révèle être une erreur, vous pourrez revenir à une version
39 antérieure d'un fichier ou même d'un ensemble de fichiers. En fait, un outil de
40 gestion de source \emph{vraiment} efficace vous permettra d'identifier à quel
41 moment le problème est apparu (voir la section~\ref{sec:undo:bisect} pour plus
42 de détails).
43 \item L'outil vous permettra aussi de travailler sur plusieurs versions différentes
44 de votre projet et à gérer l'écart entre chacune.
45 \end{itemize}
46 La plupart de ces raisons ont autant d'importances ---du moins en théorie--- que
47 vous travailliez sur un projet pour vous, ou avec une centaine d'autres
48 personnes.
50 Une question fondamentale à propos des outils de gestion de source, qu'il s'agisse
51 du projet d'une personne ou d'une grande équipe, est quels sont ses
52 \emph{avantages} par rapport à ses \emph{coûts}. Un outil qui est difficile à
53 utiliser ou à comprendre exigera un lourd effort d'adaptation.
55 Un projet de cinq milles personnes s'effondrera très certainement de lui même
56 sans aucun processus et outil de gestion de source. Dans ce cas, le coût
57 d'utilisation d'un logiciel de gestion de source est dérisoire puisque
58 \emph{sans}, l'échec est presque garanti.
60 D'un autre coté, un ``rapide hack'' d'une personne peut sembler un contexte
61 bien pauvre pour utiliser un outil de gestion de source, car, bien évidement
62 le coût d'utilisation dépasse le coût total du projet. N'est ce pas ?
64 Mercurial supporte ces \emph{deux} échelles de travail. Vous pouvez apprendre
65 les bases en quelques minutes seulement, et, grâce à sa performance, vous pouvez
66 l'utiliser avec facilité sur le plus petit des projets. Cette simplicité
67 signifie que vous n'avez pas de concept obscurs ou de séquence de commandes
68 défiant l'imagination, sans aucune corrélation avec \emph{ce que vous êtes
69 vraiment en train de faire}. En même temps, ces mêmes performances et sa
70 nature ``peer-to-peer'' vous permettent d'augmenter, sans difficulté, son
71 utilisation à de très grands projets.
73 Aucun outil de gestion de source ne peut sauver un projet mal mené, mais un
74 bon outil peut rendre beaucoup plus fluide votre travail.
76 \subsection{Les multiples noms de la gestion de source}
78 La gestion de source\footnote{NdT: J'ai utilisé systématiquement le terme
79 ``gestion de source'' à travers tout l'ouvrage. Ce n'est pas forcement la
80 meilleure traduction, et ceci peut rendre la lecture un peu lourde, mais je
81 pense que le document y gagne en clarté et en précision.} est un domaine
82 divers, tellement qu'il n'existe pas une seul nom ou acronyme pour le désigner.
83 Voilà quelqu'uns des noms ou
84 acronymes que vous rencontrerez le plus souvent\footnote{NdT: J'ai conservé la
85 liste des noms en anglais pour des raisons de commodité (ils sont plus
86 ``googelable''). En outre, j'ai opté pour conserver l'ensemble des opérations de
87 Mercurial (\textit{commit},\textit{push}, \textit{pull},...) en anglais, là
88 aussi pour faciliter la lecture d'autres documents en anglais, ainsi que
89 l'utilisation de Mercurial}.
91 :
92 \begin{itemize}
93 \item \textit{Revision control (RCS)} ;
94 \item Software configuration management (SCM), ou \textit{configuration management} ;
95 \item \textit{Source code management} ;
96 \item \textit{Source code control}, ou \textit{source control} ;
97 \item \textit{Version control (VCS)}.
98 \end{itemize}
100 Certaines personnes prétendent que ces termes ont en fait des sens
101 différents mais en pratique ils se recouvrent tellement qu'il n'y a pas
102 réellement de manière pertinente de les distinguer.
104 \section{Une courte histoire de la gestion de source}
106 Le plus célèbre des anciens outils de gestion de source est \textit{SCCS
107 (Source Code Control System)}, que Marc Rochkind conçu dans les laboratoires de
108 recherche de Bell (\textit{Bell Labs}), dans le début des années 70.
109 \textit{SCCS} ne fonctionnait que sur des fichiers individuels, et obligeait chaque
110 personne travaillant sur le projet d'avoir un accès à un répertoire de
111 travail commun, sur le même système. Seulement une seule personne pouvait
112 modifier un fichier au même moment, ce fonctionnement était assuré par
113 l'utilisation de verrou (``lock''). Il était courant que des personnes
114 verrouillent des fichiers, et plus tard, oublient de le déverrouiller;
115 empêchant n'importe qui d'autre de travailler sur ces fichiers sans l'aide de
116 l'administrateur...
118 Walter Tichy a développé une alternative libre à \textit{SCCS} au début des
119 années 80, qu'il nomma \textit{RSC (Revison Control System)}. Comme
120 \textit{SCCS}, \textit{RCS} demandait aux développeurs de travailler sur le même
121 répertoire partagé, et de verrouiller les
122 fichiers pour se prémunir de tout conflit issu de modifications concurrentes.
124 Un peu plus tard dans les années 1980, Dick Grune utilisa \textit{RCS} comme
125 une brique de base pour un ensemble de scripts \textit{shell} qu'il intitula
126 cmt, avant de la renommer en \textit{CVS (Concurrent Versions System)}. La
127 grande innovation de CVS était que les développeurs pouvaient travailler
128 simultanément et indépendamment dans leur propre espace de travail. Ces espaces
129 de travail privés assuraient que les développeurs ne se marchent pas
130 mutuellement sur les pieds, comme c'était souvent le cas avec RCS et SCCS.
131 Chaque développeur disposait donc de sa copie de tous les fichiers du projet,
132 et ils pouvaient donc librement les modifier. Ils devaient néanmoins effectuer
133 la ``fusion'' (\textit{``merge''}) de leurs fichiers, avant d'effectuer le
134 ``commit'' de leur modifications sur le dépôt central.
136 Brian Berliner reprit les scripts de Grune's et les réécrit en~C, qu'il publia
137 en 1989. Depuis, ce code a été modifié jusqu'à devenir la version moderne de
138 CVS. CVS a acquis ainsi la capacité de fonctionner en réseau, transformant son
139 architecture en client/serveur. L'architecture de CVS est centralisée, seul le
140 serveur a une copie de l'historique du projet. L'espace de travail client ne
141 contient qu'une copie de la dernière version du projet, et quelques métadonnées
142 pour indiquer où le serveur se trouve. CVS a été un grand succès, aujourd'hui
143 il est probablement l'outil de gestion de contrôle le plus utilisé au monde.
145 Au début des années 1990, Sun Microsystmes développa un premier outil de
146 gestion de source distribué, nommé TeamWare. Un espace de travail TeamWare
147 contient une copie complète de l'historique du projet. TeamWare n'a pas de
148 notion de dépôt central. (CVS utilisait RCS pour le stockage de l'historique,
149 TeamWare utilisait SCCS).
151 Alors que les années 1990 avançaient, les utilisateurs ont pris conscience d'un
152 certain nombre de problèmes avec CVS. Il enregistrait simultanément des
153 modifications sur différents fichiers individuellement, au lieu de les
154 regrouper dans une seule opération cohérente et atomique. Il ne gère pas bien
155 sa hiérarchie de fichier, il est donc assez aisé de créer le chaos en renommant
156 les fichiers et les répertoires. Pire encore, son code source est difficile à
157 lire et à maintenir, ce qui agrandit largement le ``niveau de souffrance''
158 associé à la réparation de ces problèmes d'architecture de manière prohibitive.
160 En 2001, Jim Blandy et Karl Fogel, deux développeurs qui avaient travaillé sur
161 CVS, initièrent un projet pour le remplacer par un outil qui aurait une
162 meilleure architecture et un code plus propre. Le résultat, Subversion, ne
163 quitte pas le modèle centralisé et client/server de CVS, mais ajoute les
164 opérations de ``commit'' atomique sur de multiples fichiers, une meilleure
165 gestion des espaces de noms, et d'autres fonctionnalités qui en font un
166 meilleur outil que CVS. Depuis sa première publication, il est rapidement
167 devenu très populaire.
169 Plus ou moins simultanément, Graydon Hoare a commencé sur l'ambitieux
170 système de gestion distribué Monotone. Bien que Monotone corrige plusieurs
171 défauts de CVS's tout en offrant une architecture ``peer-to-peer'', il va aussi
172 plus loin que la plupart des outils de révision de manière assez innovante. Il
173 utilise des ``hash'' cryptographiques comme identifiants, et il a une notion
174 complète de ``confiance'' du code issu des différentes sources.
176 Mercurial est né en 2005. Bien que très influencé par Monotone, Mercurial se
177 concentre sur la facilité d'utilisation, les performances et la capacité à
178 monter en charge pour de très gros projets.
180 \section{Tendances de la gestion de source}
182 Il y a eu une tendance évidente dans le développement et l'utilisation d'outils
183 de gestion de source depuis les quatre dernières décades, au fur et à mesure
184 que les utilisateurs se sont habitués à leur outils et se sont sentis contraints
185 par leurs limitations.
187 La première génération commença simplement par gérer un fichier unique sur un
188 ordinateur individuel. Cependant, même si ces outils présentaient une grande
189 avancée par rapport à la gestion manuelle des versions, leur modèle de
190 verrouillage et leur utilisation limitée à un seul ordinateur rendaient leur
191 utilisation possible uniquement dans une très petite équipe.
193 La seconde génération a assoupli ces contraintes en adoptant une architecture
194 réseau et centralisée, permettant de gérer plusieurs projets entiers en même
195 temps. Alors que les projets grandirent en taille, ils rencontrèrent de nouveaux
196 problèmes. Avec les clients discutant régulièrement avec le serveurs, la montée
197 en charge devint un réel problème sur les gros projets. Une connexion réseau
198 peu fiable pouvait complètement empêcher les utilisateurs distants de dialoguer
199 avec le serveur. Alors que les projets \textit{Open Source} commencèrent à
200 mettre en place des accès en lecture seule disponible anonymement, les
201 utilisateurs sans les privilèges de ``commit'' réalisèrent qu'ils ne pouvaient
202 pas utiliser les outils pour collaborer naturellement avec le projet, comme ils
203 ne pouvaient pas non plus enregistrer leurs modifications.
205 La génération actuelle des outils de gestion de source est ``peer-to-peer'' par
206 nature. Tout ces systèmes ont abandonné la dépendance à un serveur central, et
207 ont permis à leur utilisateur de distribuer les données de leur gestion de
208 source à qui en a besoin. La collaboration à travers Internet a transformé la
209 contrainte technologique en une simple question de choix et de consencus. Les
210 outils modernes peuvent maintenant fonctionner en mode déconnecté sans limite et
211 de manière autonome, la connexion au réseau n'étant nécessaire que pour
212 synchroniser les modifications avec les autres dépôts.
214 \section{Quelques avantages des gestionnaires de source distribués}
216 Même si les gestionnaire de source distribués sont depuis plusieurs années
217 assez robustes et aussi utilisables que leurs prédécesseurs, les utilisateurs
218 d'autres outils n'y ont pas encore été sensibilisés. Les gestionnaires
219 de source distribués se distinguent particulièrement de leurs équivalents
220 centralisés de nombreuses manières.
222 Pour un développeur individuel, ils restent beaucoup plus rapides que les
223 outils centralisés. Cela pour une raison simple : un outil centralisé doit
224 toujours dialoguer à travers le réseau pour la plupart des opérations, car
225 presque toutes les métadonnées sont stockées sur la seule copie du serveur
226 central. Un outil distribué stocke toute ses métadonnées localement. À tâche
227 égale, effectuer un échange avec le réseau ajoute un délai aux outils
228 centralisés. Ne sous-estimez pas la valeur d'un outil rapide : vous allez
229 passer beaucoup de temps à interagir avec un logiciel de gestion de source.
231 Les outils distribués sont complètement indépendants des aléas de votre serveur,
232 d'autant plus qu'ils répliquent les métadonnées à beaucoup d'endroits. Si
233 votre serveur central prend feu, vous avez intérêt à ce que les médias de
234 sauvegardes soient fiables, et que votre dernier ``backup'' soit récent et
235 fonctionne sans problème. Avec un outil distribué, vous avez autant de
236 ``backup'' que de contributeurs.
238 En outre, la fiabilité de votre réseau affectera beaucoup moins les
239 outils distribués. Vous ne pouvez même pas utiliser un outil centralisé
240 sans connexion réseau, à l'exception de quelques commandes, très limitées.
241 Avec un outil distribué, si votre connexion réseau tombe pendant que vous
242 travaillez, vous pouvez ne même pas vous en rendre compte. La seule chose
243 que vous ne serez pas capable de faire sera de communiquer avec des dépôts
244 distants, opération somme toute assez rare en comparaison aux opérations
245 locales. Si vous avez une équipe de collaborateurs très dispersée ceci peut
246 être significatif.
248 \subsection{Avantages pour les projets \textit{Open Source}}
250 Si vous prenez goût à un projet \textit{Open Source} et que vous
251 décidez de commencer à toucher à son code, et que le projet utilise
252 un gestionnaire de source distribué, vous êtes immédiatement un "pair"
253 avec les personnes formant le ``cœur'' du projet. Si ils publient
254 leurs dépôts, vous pouvez immédiatement copier leurs historiques de
255 projet, faire des modifications, enregistrer votre travail en utilisant
256 les même outils qu'eux. Par comparaison, avec un outil centralisé, vous
257 devez utiliser un logiciel en mode ``lecture seule'' à moins que
258 quelqu'un ne vous donne les privilèges de ``commit'' sur le serveur
259 central. Avant ça, vous ne serez pas capable d'enregistrer vos
260 modifications, et vos propres modifications risqueront de se
261 corrompre chaque fois que vous essayerez de mettre à jour à votre
262 espace de travail avec le serveur central.
264 \subsubsection{Le non-problème du \textit{fork}}
266 Il a été souvent suggéré que les gestionnaires de source distribués
267 posent un risque pour les projets \textit{Open Source} car ils
268 facilitent grandement la création de ``fork''\footnote{NdT:Création
269 d'une
270 \url{version alternative du logiciel}{http://fr.wikipedia.org/wiki/Fork\#Embranchement\_d.27un\_projet\_informatique}.}
271 Un ``fork'' apparait quand il y des divergences d'opinion ou d'attitude
272 au sein d'un groupe de développeurs qui aboutissent à la décision de ne
273 plus travailler ensemble. Chaque parti s'empare d'une copie plus ou moins
274 complète du code source du projet et continue dans sa propre direction.
276 Parfois ces différents partis décident de se réconcilier. Avec un
277 serveur central, l'aspect \emph{technique} de cette réconciliation
278 est un processus douloureux, et essentiellement manuel. Vous devez
279 décider quelle modification est ``la gagnante'', et replacer, par un
280 moyen ou un autre, les modifications de l'autre équipe dans l'arborescence
281 du projet. Ceci implique généralement la perte d'une partie de l'historique
282 d'un des partis, ou même des deux.
284 Ce que les outils distribués permettent à ce sujet est probablement
285 la \emph{meilleure} façon de développer un projet. Chaque modification
286 que vous effectuez est potentiellement un ``fork''. La grande force de
287 cette approche est que les gestionnaires de source distribués doivent être
288 vraiment très efficaces pour \emph{fusionner}\footnote{NdT:j'ai choisi de
289 traduire ici \textit{merging} par ``fusionner'' pour des raisons de clarté}
290 des ``forks'', car les ``forks'', dans ce contexte, arrivent tout le
291 temps.
293 Si chaque altération que n'importe qui effectue, à tout moment, est vue
294 comme un ``fork'' à fusionner, alors ce que le monde de l'\textit{Open
295 Source} voit comme un ``fork'' devient \emph{uniquement} une problématique
296 sociale. En fait, les outils de gestions de source distribués \emph{réduisent}
297 les chances de ``fork'':
298 \begin{itemize}
299 \item Ils éliminent la distinction sociale qu'imposent les outils centralisés
300 entre les membres du projets (ceux qui ont accès au ``commit'') et ceux de
301 l'extérieur (ce qui ne l'ont pas). \item Ils rendent plus facile la
302 réconciliation après un ``fork'' social, car
303 tout ce qu'elle implique est une simple fusion.
304 \end{itemize}
306 Certaines personnes font de la résistance envers les gestionnaires de source
307 distribués parce qu'ils veulent garder un contrôle ferme sur leur projet, et
308 ils pensent que les outils centralisés leur fournissent ce contrôle. Néanmoins,
309 si c'est votre cas, sachez que si vous publiez votre dépôt CVS ou Subversion
310 de manière publique, il existe une quantité d'outils disponibles pour récupérer
311 entièrement votre projet et son historique (quoique lentement) et le récréer
312 ailleurs, sans votre contrôle. En fait, votre contrôle sur votre projet est
313 illusoire, vous ne faites qu'interdire à vos collaborateurs de travailler
314 de manière fluide, en disposant d'un miroir ou d'un ``fork'' de votre
315 historique.
316 %%%TODO: Fussy, those last sentences are not really well translated:
317 %%%no problem for me (wilk)
318 %However, if you're of this belief, and you publish your CVS or Subversion
319 %repositories publically, there are plenty of tools available that can pull
320 %out your entire project's history (albeit slowly) and recreate it somewhere
321 %that you don't control. So while your control in this case is illusory, you are
322 %forgoing the ability to fluidly collaborate with whatever people feel
323 %compelled to mirror and fork your history.
325 \subsection{Avantages pour les projets commerciaux}
327 Beaucoup de projets commerciaux sont réalisés par des équipes éparpillées
328 à travers le globe. Les contributeurs qui sont loin du serveur central
329 devront subir des commandes lentes et même parfois peu fiables. Les
330 solutions propriétaires de gestion de source tentent de palier ce problème
331 avec des réplications de sites distants qui sont à la fois coûteuses à mettre
332 en place et lourdes à administrer. Un système distribué ne souffre pas
333 de ce genre de problèmes. En outre, il est très aisé de mettre en place
334 plusieurs serveurs de références, disons un par site, de manière à ce qu'il
335 n'y ait pas de communication redondante entre les dépôts, sur une connexion
336 longue distance souvent onéreuse.
338 Les systèmes de gestion de source supportent généralement assez mal la
339 montée en charge. Ce n'est pas rare pour un gestionnaire de source centralisé
340 pourtant onéreux de s'effondrer sous la charge combinée d'une douzaine
341 d'utilisateurs concurrents seulement. Une fois encore, la réponse à cette problématique
342 est généralement encore la mise en place d'un ensemble complexe de serveurs
343 synchronisés par un mécanisme de réplication. Dans le cas d'un gestionnaire
344 de source distribué, la charge du serveur central --- si vous avez un--- est
345 plusieurs fois inférieure (car toutes les données sont déjà répliquées ailleurs),
346 un simple serveur, pas très cher, peut gérer les besoins d'une plus grande
347 équipe, et la réplication pour balancer la charge devient le
348 travail d'un simple script.
350 Si vous avez des employés sur le terrain, en train de chercher à résoudre un souci sur
351 le site d'un client, ils bénéficieront aussi d'un gestionnaire de source
352 distribué. Cet outil leur permettra de générer des versions personnalisées,
353 d'essayer différentes solutions, en les isolant aisément les unes des autres,
354 et de rechercher efficacement à travers l'historique des sources, la cause
355 des bugs ou des régressions, tout ceci sans avoir besoin de la moindre
356 connexion au réseau de votre compagnie.
358 \section{Pourquoi choisir Mercurial?}
360 Mercurial a plusieurs caractéristiques qui en font un choix particulièrement
361 pertinent pour la gestion de source:
362 \begin{itemize}
363 \item Il est facile à apprendre et à utiliser ;
364 \item Il est léger et performant ;
365 \item Il monte facilement en charge ;
366 \item Il est facile à personnaliser ;
367 \end{itemize}
369 Si vous êtes déjà familier d'un outil de gestion de source, vous serez
370 capable de l'utiliser en moins de 5 minutes. Sinon, ça ne sera pas beaucoup
371 plus long\footnote{NdT: Pour appuyer le propos de l'auteur, je signale que
372 j'utilise Mercurial comme outil d'initiation à la gestion de contrôle dans
373 des travaux pratiques à l'ESME Sudria (\url{http://www.esme.fr}) et que les
374 élèves le prennent en main sans difficulté majeure malgré l'approche distribuée.}.
375 Les commandes utilisées par Mercurial, comme ses fonctionnalités, sont
376 généralement uniformes et cohérentes, et vous pouvez donc ainsi garder en tête
377 simplement quelques règles générales, plutôt qu'un lot complexe d'exceptions.
379 Sur un petit projet, vous pouvez commencer à travailler avec Mercurial en
380 quelques instants. Ajouter des modifications ou des branches, transférer
381 ces modifications (localement ou via le réseau), et les opérations
382 d'historique ou de statut sont aussi très rapides. Mercurial reste hors de
383 votre chemin grâce à sa simplicité d'utilisation et sa rapidité d'exécution.
385 L'utilité de Mercurial ne se limite pas à de petits projets: il est
386 aussi utilisé par des projets ayant des centaines ou même des milliers
387 de contributeurs, avec plusieurs dizaines de milliers de fichiers, et des
388 centaines de méga de code source.
390 Voici une liste non exhaustive des projets complexes ou critiques utilisant
391 Mercurial :
392 %TODO
393 % For both spanish and english version, add the following examples:
394 \begin{itemize}
395 \item \url{Firefox}{https://developer.mozilla.org/en/Mozilla\_Source\_Code\_(Mercurial)} ;
396 \item \url{OpenSolaris}{http://opensolaris.org/os/community/tools/scm/hg\_help/} ;
397 \item \url{OpenJDK}{http://hg.openjdk.java.net/} (utilisant en outre l'extension
398 ``forest'' pour gérer ses sous modules);
399 \end{itemize}
401 Si les fonctionnalités cœur de Mercurial ne sont pas suffisantes pour vous,
402 il est très aisé d'en construire d'autres. Mercurial est adapté à l'utilisation
403 de scripts, et son implémentation interne en Python, propre et claire,
404 rend encore plus facile l'ajout de fonctionnalités sous forme d'extensions. Il
405 en existe déjà un certain nombre de très populaires et très utiles,
406 dont le périmètre va de la recherche de bugs à l'amélioration des performances.
408 \section{Mercurial comparé aux autres outils}
410 Avant que vous n'alliez plus loin, comprenez bien que cette section
411 reflète mes propres expériences, et elle est donc (j'ose le dire)
412 peu objective. Néanmoins, j'ai utilisé les outils de gestion de source
413 listés ci dessous, dans la plupart des cas, pendant plusieurs années.
414 %% TODO: Fussy translation.
416 \subsection{Subversion}
418 Subversion est un des outils de gestion de source les plus populaire, il fût
419 développé pour remplacer CVS. Il a une architecture client/server centralisée.
421 Subversion et Mercurial ont des noms de commandes très similaires pour
422 les mêmes opérations, ainsi si vous êtes familier avec l'un, c'est facile
423 d'apprendre l'autre. Ces deux outils sont portables sur les systèmes
424 d'exploitation les plus populaires\footnote{NdT:Mercurial fonctionne sans problème
425 sur OpenVMS à l'ESME Sudria \url{http://www.esme.fr}, compte tenu que Subversion a été
426 développé en C, je ne suis pas sûr que son portage aurait été aussi aisé.}.
427 %TODO: Backport this statement in english and spanish
429 Avant la version 1.5, Subversion n'offrait aucune forme de support pour les fusions. Lors
430 de l'écriture de ce livre, ses capacités de fusion étaient nouvelles, et réputées pour être
431 \href{http://svnbook.red-bean.com/nightly/en/svn.branchmerge.advanced.html#svn.branchmerge.advanced.finalword}{complexes
432 et bugguées}.
434 Mercurial dispose d'un avantage substantiel en terme de performance par rapport à
435 Subversion sur la plupart des opérations que j'ai pu tester. J'ai mesuré
436 une différence de performance allant de deux à six fois plus rapide avec
437 le système de stockage de fichier local de Subversion~1.4.3
438 (\emph{ra\_local}), qui est la méthode d'accès la plus rapide disponible. Dans
439 un déploiement plus réaliste, impliquant un stockage réseau, Subversion
440 serait encore plus désavantagé. Parce que la plupart des commandes Subversion
441 doivent communiquer avec le serveur et que Subversion n'a pas de mécanisme
442 de réplication, la capacité du serveur et la bande passante sont devenues des
443 goulots d'étranglement pour les projets de taille moyenne ou grande.
445 En outre, Subversion implique une surcharge substantielle dans le stockage local
446 de certaines données, pour éviter des transactions avec le serveur, pour
447 certaines opérations communes, telles que la recherche des fichiers modifiés
448 (\texttt{status}) et l'affichage des modifications par rapport à la révision
449 courante (\texttt{diff}). En conséquence, un répertoire de travail Subversion
450 a souvent la même taille, ou est plus grand, qu'un dépôt Mercurial et son
451 espace de travail, et ceci bien que le dépôt Mercurial contienne l'intégralité
452 de l'historique.
454 Subversion est largement supporté par les outils tierces. Mercurial est
455 actuellement encore en retrait de ce point de vue. L'écart se réduit, néanmoins,
456 et en effet certains des outils graphiques sont maintenant supérieurs à leurs
457 équivalents Subversion. Comme Mercurial, Subversion dispose d'un excellent
458 manuel utilisateur.
460 Parce que Subversion ne stocke pas l'historique chez ses clients, il est
461 parfaitement adapté à la gestion de projets qui doivent suivre un ensemble
462 de larges fichiers binaires et opaques. Si vous suivez une cinquantaine de
463 versions d'un fichier incompressible de 10MB, l'occupation disque coté client
464 d'un projet sous Subversion restera à peu près constante. A l'inverse,
465 l'occupation disque du même projet sous n'importe lequel des gestionnaires
466 de source distribués grandira rapidement, proportionnellement aux nombres
467 de versions, car les différences entre chaque révisions seront très grandes.
469 En outre, c'est souvent difficile ou, généralement, impossible de fusionner
470 des différences dans un fichier binaire. La capacité de Subversion de
471 verrouiller des fichiers, pour permettre à l'utilisateur d'être le seul
472 à le mettre à jour (``commit'') temporairement, est un avantage significatif
473 dans un projet doté de beaucoup de fichiers binaires.
475 Mercurial peut importer l'historique depuis un dépôt Subversion. Il peut
476 aussi exporter l'ensemble des révisions d'un projet vers un dépôt Subversion.
477 Ceci rend très facile de ``prendre la température'' et d'utiliser Mercurial et Subversion
478 en parallèle, avant de décider de migrer vers Mercurial. La conversion de
479 l'historique est incrémentale, donc vous pouvez effectuer une conversion
480 initiale, puis de petites additions par la suite pour ajouter les nouvelles
481 modifications.
483 \subsection{Git}
485 Git est un outil de gestion de source distribué qui fût développé pour gérer
486 le code source de noyau de Linux. Comme Mercurial, sa conception initiale a
487 été inspirée par Monotone.
489 Git dispose d'un ensemble conséquent de commandes, avec plus de~139 commandes
490 individuelles pour la version~1.5.0. Il a aussi la réputation d'être difficile
491 à apprendre. Comparé à Git, le point fort de Mercurial est clairement sa
492 simplicité.
494 En terme de performance, Git est extrêmement rapide. Dans la plupart des
495 cas, il est plus rapide que Mercurial, tout du moins sur Linux, alors que
496 Mercurial peut être plus performant sur d'autres opérations. Néanmoins, sur
497 Windows, les performances et le niveau de support général fourni par Git,
498 au moment de l'écriture de cet ouvrage, est bien derrière celui de Mercurial.
500 Alors que le dépôt Mercurial ne demande aucune maintenance, un dépôt Git
501 exige d'exécuter manuellement et régulièrement la commande ``repacks'' sur
502 ces métadonnées. Sans ceci, les performances de git se dégradent et la
503 consommation de l'espace disque augmente rapidement. Un serveur qui contient
504 plusieurs dépôts Git qui ne sont pas régulièrement et fréquemment ``repacked''
505 deviendra un vrai problème lors des ``backups'' du disque, et il y eu des
506 cas, où un ``backup'' journalier pouvait durer plus de~24 heures. Un dépôt
507 fraichement ``repacked'' sera légèrement plus petit qu'un dépôt Mercurial,
508 mais un dépôt non ``repacked'' est beaucoup plus grand.
510 Le cœur de Git est écrit en C. La plupart des commandes Git sont implémentées
511 sous forme de scripts Shell ou Perl, et la qualité de ces scripts varie
512 grandement. J'ai plusieurs fois constaté que certains de ces scripts étaient
513 chargés en mémoire aveuglément et que la présence d'erreurs pouvait s'avérer
514 fatal.
516 Mercurial peut importer l'historique d'un dépôt Git.
518 \subsection{CVS}
520 CVS est probablement l'outil de gestion de source le plus utilisé aujourd'hui
521 dans le monde. À cause de son manque de clarté interne, il n'est plus
522 maintenu depuis plusieurs années.
524 Il a une architecture client/serveur centralisée. Il ne regroupe pas les
525 modifications de fichiers dans une opération de ``commit'' atomique, ce
526 qui permet à ses utilisateurs de ``casser le \textit{build}'' assez
527 facilement : une personne peut effectuer une opération de ``commit''
528 sans problème puis être bloquée par besoin de fusion, avec comme conséquence
529 néfaste, que les autres utilisateurs ne récupèreront qu'une partie de ses
530 modifications. Ce problème affecte aussi la manière de travailler avec
531 l'historique du projet. Si vous voulez voir toutes les modifications d'une
532 personne du projet, vous devrez injecter manuellement les descriptions et les
533 \textit{timestamps} des modifications de chacun des fichiers impliqués (si
534 vous savez au moins quels sont ces fichiers).
536 CVS a une notion étrange des \textit{tags} et des branches que je n'essayerai
537 même pas de décrire ici. Il ne supporte pas bien les opérations de renommage d'un
538 fichier ou d'un répertoire, ce qui facilite la corruption de son dépôt. Il n'a
539 presque pas pour ainsi dire de contrôle de cohérence interne, il est donc
540 pratiquement impossible de dire si un dépôt est corrompu ni à quel point. Je
541 ne recommanderai pas CVS pour un projet existant ou nouveau.
543 Mercurial peut importer l'historique d'un projet CVS. Néanmoins, il y a
544 quelques principes à respecter; ce qui est vrai aussi pour les autres
545 outils d'import de projet CVS. À cause de l'absence de ``commit'' atomique
546 et gestion de version de l'arborescence, il n'est pas possible de reconstruire
547 de manière précise l'ensemble de l'historique. Un travail de ``devinette''
548 est donc nécessaire, et les fichiers renommés ne sont pas détectés. Parce
549 qu'une bonne part de l'administration d'un dépôt CVS est effectuée manuellement,
550 et est donc, sujette à erreur, il est courant que les imports CVS rencontrent
551 de nombreux problèmes avec les dépôt corrompus (des \textit{timestamps}
552 de révision complètement buggés et des fichiers verrouillés depuis des années
553 sont deux des problèmes les moins intéressants dont je me souvienne).
555 Mercurial peut importer l'historique depuis un dépôt CVS.
557 \subsection{Outils propriétaires}
559 Perforce a une architecture client/serveur centralisée, sans aucun
560 mécanisme de mise en cache de données coté client. Contrairement à la plupart
561 des outils modernes de gestion de source, Perforce exige de ses
562 utilisateurs d'exécuter une commande pour informer le serveur
563 central de tout fichier qu'ils souhaitent modifier.
565 Les performances de Perforce sont plutôt bonnes pour des petites
566 équipes, mais elles s'effondrent rapidement lorsque le nombre
567 d'utilisateurs augmente au delà de la douzaine. Des installations
568 de Perforce assez larges nécessitent le déploiement de proxies pour
569 supporter la montée en charge associée.
571 \subsection{Choisir un outil de gestion de source}
573 A l'exception de CVS, tous les outils listés ci-dessus ont des
574 forces qui leur sont propres et qui correspondent à certaines
575 formes de projet. Il n'y a pas un seul meilleur outil de gestion
576 de source qui correspondrait le mieux à toutes les situations.
578 Par exemple, Subversion est un très bon choix lorsqu'on travaille
579 avec beaucoup de fichiers binaires, qui évoluent régulièrement, grâce
580 à sa nature centralisée et sa capacité à verrouiller des fichiers.
582 Personnellement, je préfère Mercurial pour sa simplicité, ses
583 performances et sa bonne capacité de fusion, et il m'a très bien rendu service
584 de plusieurs années maintenant.
586 \section{Migrer depuis un outil à Mercurial}
588 Mercurial est livré avec une extension nommée \hgext{convert}, qui
589 peut de manière incrémentale importer des révisions depuis différents
590 autres outils de gestion de source. Par ``incrémental'', j'entends que
591 vous pouvez convertir l'historique entier du projet en une seule fois,
592 puis relancer l'outil d'import plus tard pour obtenir les modifications
593 effectuées depuis votre import initial.
595 Les outils de gestion de source supportés par \hgext{convert} sont :
596 \begin{itemize}
597 \item Subversion
598 \item CVS
599 \item Git
600 \item Darcs
601 \end{itemize}
603 En outre, \hgext{convert} peut exporter les modifications depuis Mercurial
604 vers Subversion. Ceci rend possible d'essayer Subversion en parallèle
605 avant de choisir une solution définitive, sans aucun risque de perte de
606 données.
608 La commande \hgxcmd{conver}{convert} est très simple à utiliser. Simplement,
609 indiquez le chemin ou l'URL du dépôt de source, en lui indiquant éventuellement
610 le nom du chemin de destination, et la conversion se met en route. Après cet
611 import initial, il suffit de relancer la commande encore une fois pour
612 importer les modifications effectuées depuis.
614 %%% Local Variables:
615 %%% mode: latex
616 %%% TeX-master: "00book"
617 %%% End: