hgbook: de3b3aaaa159 fr/intro.tex

hgbook

view fr/intro.tex @ 951:de3b3aaaa159

Finished works on tour-basic... Still need reviewing, especially the last 200 lines

author	Romain PELISSE <belaran@gmail.com>
date	Tue Feb 17 23:08:16 2009 +0100 (2009-02-17)
parents	eb01681e0bb8
children	f2cd9743c473

line source

1 \chapter{Introduction}

2 \label{chap:intro}

4 \section{À propos de la gestion source}

6 La gestion de sources est un processus permettant de gérer différentes

7 versions de la même information. Dans sa forme la plus simple, c'est

8 ce que tout le monde fait manuellement : quand vous modifiez

9 un fichier, vous le sauvegardez sous un nouveau nom contenant un numéro,

10 à chaque fois plus grand que celui de la version précédente.

12 Ce genre de gestion de version manuelle est cependant facilement sujette

13 à des erreurs, ainsi, depuis longtemps, des logiciels existent pour

14 résoudre cette problématique. Les premiers outils de gestion de sources

15 étaient destinés à aider un seul utilisateur, à automatiser la gestion

16 des versions d'un seul fichier. Dans les dernières décades, cette cible

17 s'est largement agrandie, ils gèrent désormais de multiples fichiers, et

18 aident un grand nombre de personnes à travailler ensemble. Les outils les

19 plus modernes n'ont aucune difficulté à gérer plusieurs milliers de

20 personnes travaillant ensemble sur des projets regroupant plusieurs

21 centaines de milliers de fichiers.

23 \subsection{Pourquoi utiliser un gestionnaire de source ?}

25 Il y a de nombreuses raisons pour que vous ou votre équipe souhaitiez

26 utiliser un outil automatisant la gestion de version pour votre projet.

27 \begin{itemize}

28 \item L'outil se chargera de suivre l'évolution de votre projet, sans

29 que vous n'ayez à le faire. Pour chaque modification, vous aurez à votre

30 disposition un journal indiquant \emph{qui} a fait quoi, \emph{pourquoi}

31 ils l'ont fait, \emph{quand} ils l'ont fait, et \emph{ce} qu'ils ont

32 modifiés.

33 \item Quand vous travaillez avec d'autres personnes, les logiciels de

34 gestion de source facilitent le travail collaboratif. Par exemple, quand

35 plusieurs personnes font, plus ou moins simultanément, des modifications

36 incompatibles, le logiciel vous aidera à identifier et à résoudre les conflits.

37 \item L'outil vous aidera à réparer vos erreurs. Si vous effectuez un changement

38 qui se révèle être une erreur, vous pourrez revenir à une version

39 antérieure d'un fichier ou même d'un ensemble de fichiers. En fait, un outil de

40 gestion de source \emph{vraiment} efficace vous permettra d'identifier à quel

41 moment le problème est apparu (voir la section~\ref{sec:undo:bisect} pour plus

42 de détails).

43 \item L'outil vous permettra aussi de travailler sur plusieurs versions différentes

44 de votre projet et à gérer l'écart entre chacune.

45 \end{itemize}

46 La plupart de ces raisons ont autant d'importances ---du moins en théorie--- que

47 vous travailliez sur un projet pour vous, ou avec une centaine d'autres

48 personnes.

50 Une question fondamentale à propos des outils de gestion de source, qu'il s'agisse

51 du projet d'une personne ou d'une grande équipe, est quels sont ses

52 \emph{avantages} par rapport à ses \emph{coûts}. Un outil qui est difficile à

53 utiliser ou à comprendre exigera un lourd effort d'adaptation.

55 Un projet de cinq milles personnes s'effondrera très certainement de lui même

56 sans aucun processus et outil de gestion de source. Dans ce cas, le coût

57 d'utilisation d'un logiciel de gestion de source est dérisoire puisque

58 \emph{sans}, l'échec est presque garanti.

60 D'un autre coté, un ``rapide hack'' d'une personne peut sembler un contexte

61 bien pauvre pour utiliser un outil de gestion de source, car, bien évidement

62 le coût d'utilisation dépasse le coût total du projet. N'est ce pas ?

64 Mercurial supporte ces \emph{deux} échelles de travail. Vous pouvez apprendre

65 les bases en quelques minutes seulement, et, grâce à sa performance, vous pouvez

66 l'utiliser avec facilité sur le plus petit des projets. Cette simplicité

67 signifie que vous n'avez pas de concept obscurs ou de séquence de commandes

68 défiant l'imagination, sans aucune corrélation avec \emph{ce que vous êtes

69 vraiment en train de faire}. En même temps, ces mêmes performances et sa

70 nature ``peer-to-peer'' vous permettent d'augmenter, sans difficulté, son

71 utilisation à de très grands projets.

73 Aucun outil de gestion de source ne peut sauver un projet mal mené, mais un

74 bon outil peut rendre beaucoup plus fluide votre travail.

76 \subsection{Les multiples noms de la gestion de source}

78 La gestion de source\footnote{NdT: J'ai utilisé systématiquement le terme

79 ``gestion de source'' à travers tout l'ouvrage. Ce n'est pas forcement la

80 meilleure traduction, et ceci peut rendre la lecture un peu lourde, mais je

81 pense que le document y gagne en clarté et en précision.} est un domaine

82 divers, tellement qu'il n'existe pas une seul nom ou acronyme pour le désigner.

83 Voilà quelqu'uns des noms ou

84 acronymes que vous rencontrerez le plus souvent\footnote{NdT: J'ai conservé la

85 liste des noms en anglais pour des raisons de commodité (ils sont plus

86 ``googelable''). En outre, j'ai opté pour conserver l'ensemble des opérations de

87 Mercurial (\textit{commit},\textit{push}, \textit{pull},...) en anglais, là

88 aussi pour faciliter la lecture d'autres documents en anglais, ainsi que

89 l'utilisation de Mercurial}.

91 :

92 \begin{itemize}

93 \item \textit{Revision control (RCS)} ;

94 \item Software configuration management (SCM), ou \textit{configuration management} ;

95 \item \textit{Source code management} ;

96 \item \textit{Source code control}, ou \textit{source control} ;

97 \item \textit{Version control (VCS)}.

98 \end{itemize}

100 Certaines personnes prétendent que ces termes ont en fait des sens

101 différents mais en pratique ils se recouvrent tellement qu'il n'y a pas

102 réellement de manière pertinente de les distinguer.

103

104 \section{Une courte histoire de la gestion de source}

105

106 Le plus célèbre des anciens outils de gestion de source est \textit{SCCS

107 (Source Code Control System)}, que Marc Rochkind conçu dans les laboratoires de

108 recherche de Bell (\textit{Bell Labs}), dans le début des années 70.

109 \textit{SCCS} ne fonctionnait que sur des fichiers individuels, et obligeait chaque personne travaillant sur le projet d'avoir un accès à un répertoire de

110 travail commun, sur le même système. Seulement une seule personne pouvait

111 modifier un fichier au même moment, ce fonctionnement était assuré par

112 l'utilisation de verrou (``lock''). Il était courant que des personnes

113 verrouillent des fichiers, et plus tard, oublient de le déverrouiller;

114 empêchant n'importe qui d'autre de travailler sur ces fichiers sans l'aide de

115 l'administrateur...

116

117 Walter Tichy a développé une alternative libre à \textit{SCCS} au début des

118 années 80, qu'il nomma \textit{RSC (Revison Control System)}. Comme

119 \textit{SCCS}, \textit{RCS} demandait aux développeurs de travailler sur le même

120 répertoire partagé, et de verrouiller les

121 fichiers pour se prémunir de tout conflit issu de modifications concurrentes.

122

123 Un peu plus tard dans les années 1980, Dick Grune utilisa \textit{RCS} comme

124 une brique de base pour un ensemble de scripts \textit{shell} qu'il intitula

125 cmt, avant de la renommer en \textit{CVS (Concurrent Versions System)}. La

126 grande innovation de CVS était que les développeurs pouvaient travailler

127 simultanément et indépendamment dans leur propre espace de travail. Ces espaces

128 de travail privés assuraient que les développeurs ne se marchent pas

129 mutuellement sur les pieds, comme c'était souvent le cas avec RCS et SCCS.

130 Chaque développeur disposait donc de sa copie de tous les fichiers du projet,

131 et ils pouvaient donc librement les modifier. Ils devaient néanmoins effectuer

132 la ``fusion'' (\textit{``merge''}) de leurs fichiers, avant d'effectuer le

133 ``commit'' de leur modifications sur le dépôt central.

134

135 Brian Berliner reprit les scripts de Grune's et les réécrit en~C, qu'il publia

136 en 1989. Depuis, ce code a été modifié jusqu'à devenir la version moderne de

137 CVS. CVS a acquis ainsi la capacité de fonctionner en réseau, transformant son

138 architecture en client/serveur. L'architecture de CVS est centralisée, seul le

139 serveur a une copie de l'historique du projet. L'espace de travail client ne

140 contient qu'une copie de la dernière version du projet, et quelques métadonnées

141 pour indiquer où le serveur se trouve. CVS a été un grand succès, aujourd'hui

142 il est probablement l'outil de gestion de contrôle le plus utilisé au monde.

143

144 Au début des années 1990, Sun Microsystmes développa un premier outil de

145 gestion de source distribué, nommé TeamWare. Un espace de travail TeamWare

146 contient une copie complète de l'historique du projet. TeamWare n'a pas de

147 notion de dépôt central. (CVS utilisait RCS pour le stockage de l'historique,

148 TeamWare utilisait SCCS).

149

150 Alors que les années 1990 avançaient, les utilisateurs ont pris conscience d'un

151 certain nombre de problèmes avec CVS. Il enregistrait simultanément des

152 modifications sur différents fichiers individuellement, au lieu de les

153 regrouper dans une seule opération cohérente et atomique. Il ne gère pas bien

154 sa hiérarchie de fichier, il est donc assez aisé de créer le chaos en renommant

155 les fichiers et les répertoires. Pire encore, son code source est difficile à

156 lire et à maintenir, ce qui agrandit largement le ``niveau de souffrance''

157 associé à la réparation de ces problèmes d'architecture de manière prohibitive.

158

159 En 2001, Jim Blandy et Karl Fogel, deux développeurs qui avaient travaillé sur

160 CVS, initièrent un projet pour le remplacer par un outil qui aurait une

161 meilleure architecture et un code plus propre. Le résultat, Subversion, ne

162 quitte pas le modèle centralisé et client/server de CVS, mais ajoute les

163 opérations de ``commit'' atomique sur de multiples fichiers, une meilleure

164 gestion des espaces de noms, et d'autres fonctionnalités qui en font un

165 meilleur outil que CVS. Depuis sa première publication, il est rapidement

166 devenu très populaire.

167

168 Plus ou moins simultanément, Graydon Hoare a commencé sur l'ambitieux

169 système de gestion distribué Monotone. Bien que Monotone corrige plusieurs

170 défauts de CVS's tout en offrant une architecture ``peer-to-peer'', il va aussi

171 plus loin que la plupart des outils de révision de manière assez innovante. Il

172 utilise des ``hash'' cryptographiques comme identifiants, et il a une notion

173 complète de ``confiance'' du code issu des différentes sources.

174

175 Mercurial est né en 2005. Bien que très influencé par Monotone, Mercurial se

176 concentre sur la facilité d'utilisation, les performances et la capacité à

177 monter en charge pour de très gros projets.

178

179 \section{Tendances de la gestion de source}

180

181 Il y a eu une tendance évidente dans le développement et l'utilisation d'outils

182 de gestion de source depuis les quatre dernières décades, au fur et à mesure

183 que les utilisateurs se sont habitués à leur outils et se sont sentis contraints

184 par leurs limitations.

185

186 La première génération commença simplement par gérer un fichier unique sur un

187 ordinateur individuel. Cependant, même si ces outils présentaient une grande

188 avancée par rapport à la gestion manuelle des versions, leur modèle de

189 verrouillage et leur utilisation limitée à un seul ordinateur rendaient leur

190 utilisation possible uniquement dans une très petite équipe.

191

192 La seconde génération a assoupli ces contraintes en adoptant une architecture

193 réseau et centralisée, permettant de gérer plusieurs projets entiers en même

194 temps. Alors que les projets grandirent en taille, ils rencontrèrent de nouveaux

195 problèmes. Avec les clients discutant régulièrement avec le serveurs, la montée

196 en charge devint un réel problème sur les gros projets. Une connexion réseau

197 peu fiable pouvait complètement empêcher les utilisateurs distants de dialoguer

198 avec le serveur. Alors que les projets \textit{Open Source} commencèrent à

199 mettre en place des accès en lecture seule disponible anonymement, les

200 utilisateurs sans les privilèges de ``commit'' réalisèrent qu'ils ne pouvaient

201 pas utiliser les outils pour collaborer naturellement avec le projet, comme ils

202 ne pouvaient pas non plus enregistrer leurs modifications.

203

204 La génération actuelle des outils de gestion de source est ``peer-to-peer'' par

205 nature. Tout ces systèmes ont abandonné la dépendance à un serveur central, et

206 ont permis à leur utilisateur de distribuer les données de leur gestion de

207 source à qui en a besoin. La collaboration à travers Internet a transformé la

208 contrainte technologique en une simple question de choix et de consencus. Les

209 outils modernes peuvent maintenant fonctionner en mode déconnecté sans limite et

210 de manière autonome, la connexion au réseau n'étant nécessaire que pour

211 synchroniser les modifications avec les autres dépôts.

212

213 \section{Quelques avantages des gestionnaires de source distribués}

214

215 Même si les gestionnaire de source distribués sont depuis plusieurs années

216 assez robustes et aussi utilisables que leurs prédécesseurs, les utilisateurs

217 d'autres outils n'y ont pas encore été sensibilisés. Les gestionnaires

218 de source distribués se distinguent particulièrement de leurs équivalents

219 centralisés de nombreuses manières.

220

221 Pour un développeur individuel, ils restent beaucoup plus rapides que les

222 outils centralisés. Cela pour une raison simple : un outil centralisé doit

223 toujours dialoguer à travers le réseau pour la plupart des opérations, car

224 presque toutes les métadonnées sont stockées sur la seule copie du serveur

225 central. Un outil distribué stocke toute ses métadonnées localement. À tâche

226 égale, effectuer un échange avec le réseau ajoute un délai aux outils

227 centralisés. Ne sous-estimez pas la valeur d'un outil rapide : vous allez

228 passer beaucoup de temps à interagir avec un logiciel de gestion de source.

229

230 Les outils distribués sont complètement indépendants des aléas de votre serveur,

231 d'autant plus qu'ils répliquent les métadonnées à beaucoup d'endroits. Si

232 votre serveur central prend feu, vous avez intérêt à ce que les médias de

233 sauvegardes soient fiables, et que votre dernier ``backup'' soit récent et

234 fonctionne sans problème. Avec un outil distribué, vous avez autant de

235 ``backup'' que de contributeurs.

236

237 En outre, la fiabilité de votre réseau affectera beaucoup moins les

238 outils distribués. Vous ne pouvez même pas utiliser un outil centralisé

239 sans connexion réseau, à l'exception de quelques commandes, très limitées.

240 Avec un outil distribué, si votre connexion réseau tombe pendant que vous

241 travaillez, vous pouvez ne même pas vous en rendre compte. La seule chose

242 que vous ne serez pas capable de faire sera de communiquer avec des dépôts

243 distants, opération somme toute assez rare en comparaison aux opérations

244 locales. Si vous avez une équipe de collaborateurs très dispersée ceci peut

245 être significatif.

246

247 \subsection{Avantages pour les projets \textit{Open Source}}

248

249 Si vous prenez goût à un projet \textit{Open Source} et que vous

250 décidez de commencer à toucher à son code, et que le projet utilise

251 un gestionnaire de source distribué, vous êtes immédiatement un "pair"

252 avec les personnes formant le ``cœur'' du projet. Si ils publient

253 leurs dépôts, vous pouvez immédiatement copier leurs historiques de

254 projet, faire des modifications, enregistrer votre travail en utilisant

255 les même outils qu'eux. Par comparaison, avec un outil centralisé, vous

256 devez utiliser un logiciel en mode ``lecture seule'' à moins que

257 quelqu'un ne vous donne les privilèges de ``commit'' sur le serveur

258 central. Avant ça, vous ne serez pas capable d'enregistrer vos

259 modifications, et vos propres modifications risqueront de se

260 corrompre chaque fois que vous essayerez de mettre à jour à votre

261 espace de travail avec le serveur central.

262

263 \subsubsection{Le non-problème du \textit{fork}}

264

265 Il a été souvent suggéré que les gestionnaires de source distribués

266 posent un risque pour les projets \textit{Open Source} car ils

267 facilitent grandement la création de ``fork''\footnote{NdT:Création

268 d'une

269 \url{version alternative du logiciel}{http://fr.wikipedia.org/wiki/Fork\#Embranchement\_d.27un\_projet\_informatique}.}

270 Un ``fork'' apparait quand il y des divergences d'opinion ou d'attitude

271 au sein d'un groupe de développeurs qui aboutissent à la décision de ne

272 plus travailler ensemble. Chaque parti s'empare d'une copie plus ou moins

273 complète du code source du projet et continue dans sa propre direction.

274

275 Parfois ces différents partis décident de se réconcilier. Avec un

276 serveur central, l'aspect \emph{technique} de cette réconciliation

277 est un processus douloureux, et essentiellement manuel. Vous devez

278 décider quelle modification est ``la gagnante'', et replacer, par un

279 moyen ou un autre, les modifications de l'autre équipe dans l'arborescence

280 du projet. Ceci implique généralement la perte d'une partie de l'historique

281 d'un des partis, ou même des deux.

282

283 Ce que les outils distribués permettent à ce sujet est probablement

284 la \emph{meilleure} façon de développer un projet. Chaque modification

285 que vous effectuez est potentiellement un ``fork''. La grande force de

286 cette approche est que les gestionnaires de source distribués doivent être

287 vraiment très efficaces pour \emph{fusionner}\footnote{NdT:j'ai choisi de

288 traduire ici \textit{merging} par ``fusionner'' pour des raisons de clarté}

289 des ``forks'', car les ``forks'', dans ce contexte, arrivent tout le

290 temps.

291

292 Si chaque altération que n'importe qui effectue, à tout moment, est vue

293 comme un ``fork'' à fusionner, alors ce que le monde de l'\textit{Open

294 Source} voit comme un ``fork'' devient \emph{uniquement} une problématique

295 sociale. En fait, les outils de gestions de source distribués \emph{réduisent}

296 les chances de ``fork'':

297 \begin{itemize}

298 \item Ils éliminent la distinction sociale qu'imposent les outils centralisés

299 entre les membres du projets (ceux qui ont accès au ``commit'') et ceux de l'extérieur (ce qui ne l'ont pas).

300 \item Ils rendent plus facile la réconciliation après un ``fork'' social, car

301 tout ce qu'elle implique est une simple fusion.

302 \end{itemize}

303

304 Certaines personnes font de la résistance envers les gestionnaires de source

305 distribués parce qu'ils veulent garder un contrôle ferme sur leur projet, et

306 ils pensent que les outils centralisés leur fournissent ce contrôle. Néanmoins,

307 si c'est votre cas, sachez que si vous publiez votre dépôt CVS ou Subversion

308 de manière publique, il existe une quantité d'outils disponibles pour récupérer

309 entièrement votre projet et son historique (quoique lentement) et le récréer

310 ailleurs, sans votre contrôle. En fait, votre contrôle sur votre projet est

311 illusoire, vous ne faites qu'interdire à vos collaborateurs de travailler

312 de manière fluide, en disposant d'un miroir ou d'un ``fork'' de votre

313 historique.

314 %%%TODO: Fussy, those last sentences are not really well translated:

315 %%%no problem for me (wilk)

316 %However, if you're of this belief, and you publish your CVS or Subversion

317 %repositories publically, there are plenty of tools available that can pull

318 %out your entire project's history (albeit slowly) and recreate it somewhere

319 %that you don't control. So while your control in this case is illusory, you are

320 %forgoing the ability to fluidly collaborate with whatever people feel

321 %compelled to mirror and fork your history.

322

323 \subsection{Avantages pour les projets commerciaux}

324

325 Beaucoup de projets commerciaux sont réalisés par des équipes éparpillées

326 à travers le globe. Les contributeurs qui sont loin du serveur central

327 devront subir des commandes lentes et même parfois peu fiables. Les

328 solutions propriétaires de gestion de source tentent de palier ce problème

329 avec des réplications de sites distants qui sont à la fois coûteuses à mettre

330 en place et lourdes à administrer. Un système distribué ne souffre pas

331 de ce genre de problèmes. En outre, il est très aisé de mettre en place

332 plusieurs serveurs de références, disons un par site, de manière à ce qu'il

333 n'y ait pas de communication redondante entre les dépôts, sur une connexion

334 longue distance souvent onéreuse.

335

336 Les systèmes de gestion de source supportent généralement assez mal la

337 montée en charge. Ce n'est pas rare pour un gestionnaire de source centralisé

338 pourtant onéreux de s'effondrer sous la charge combinée d'une douzaine

339 d'utilisateurs concurrents seulement. Une fois encore, la réponse à cette problématique

340 est généralement encore la mise en place d'un ensemble complexe de serveurs

341 synchronisés par un mécanisme de réplication. Dans le cas d'un gestionnaire

342 de source distribué, la charge du serveur central --- si vous avez un--- est

343 plusieurs fois inférieure (car toutes les données sont déjà répliquées ailleurs),

344 un simple serveur, pas très cher, peut gérer les besoins d'une plus grande

345 équipe, et la réplication pour balancer la charge devient le

346 travail d'un simple script.

347

348 Si vous avez des employés sur le terrain, en train de chercher à résoudre un souci sur

349 le site d'un client, ils bénéficieront aussi d'un gestionnaire de source

350 distribué. Cet outil leur permettra de générer des versions personnalisées,

351 d'essayer différentes solutions, en les isolant aisément les unes des autres,

352 et de rechercher efficacement à travers l'historique des sources, la cause

353 des bugs ou des régressions, tout ceci sans avoir besoin de la moindre

354 connexion au réseau de votre compagnie.

355

356 \section{Pourquoi choisir Mercurial?}

357

358 Mercurial a plusieurs caractéristiques qui en font un choix particulièrement

359 pertinent pour la gestion de source:

360 \begin{itemize}

361 \item Il est facile à apprendre et à utiliser ;

362 \item Il est léger et performant ;

363 \item Il monte facilement en charge ;

364 \item Il est facile à personnaliser ;

365 \end{itemize}

366

367 Si vous êtes déjà familier d'un outil de gestion de source, vous serez

368 capable de l'utiliser en moins de 5 minutes. Sinon, ça ne sera pas beaucoup

369 plus long\footnote{NdT: Pour appuyer le propos de l'auteur, je signale que

370 j'utilise Mercurial comme outil d'initiation à la gestion de contrôle dans

371 des travaux pratiques à l'ESME Sudria (\url{http://www.esme.fr}) et que les

372 élèves le prennent en main sans difficulté majeure malgré l'approche distribuée.}.

373 Les commandes utilisées par Mercurial, comme ses fonctionnalités, sont

374 généralement uniformes et cohérentes, et vous pouvez donc ainsi garder en tête

375 simplement quelques règles générales, plutôt qu'un lot complexe d'exceptions.

376

377 Sur un petit projet, vous pouvez commencer à travailler avec Mercurial en

378 quelques instants. Ajouter des modifications ou des branches, transférer

379 ces modifications (localement ou via le réseau), et les opérations

380 d'historique ou de statut sont aussi très rapides. Mercurial reste hors de

381 votre chemin grâce à sa simplicité d'utilisation et sa rapidité d'exécution.

382

383 L'utilité de Mercurial ne se limite pas à de petits projets: il est

384 aussi utilisé par des projets ayant des centaines ou même des milliers

385 de contributeurs, avec plusieurs dizaines de milliers de fichiers, et des

386 centaines de méga de code source.

387

388 Voici une liste non exhaustive des projets complexes ou critiques utilisant

389 Mercurial :

390 %TODO

391 % For both spanish and english version, add the following examples:

392 \begin{itemize}

393 \item \url{Firefox}{https://developer.mozilla.org/en/Mozilla\_Source\_Code\_(Mercurial)} ;

394 \item \url{OpenSolaris}{http://opensolaris.org/os/community/tools/scm/hg\_help/} ;

395 \item \url{OpenJDK}{http://hg.openjdk.java.net/} (utilisant en outre l'extension

396 ``forest'' pour gérer ses sous modules);

397 \end{itemize}

398

399 Si les fonctionnalités cœur de Mercurial ne sont pas suffisantes pour vous,

400 il est très aisé d'en construire d'autres. Mercurial est adapté à l'utilisation

401 de scripts, et son implémentation interne en Python, propre et claire,

402 rend encore plus facile l'ajout de fonctionnalités sous forme d'extensions. Il

403 en existe déjà un certain nombre de très populaires et très utiles,

404 dont le périmètre va de la recherche de bugs à l'amélioration des performances.

405

406 \section{Mercurial comparé aux autres outils}

407

408 Avant que vous n'alliez plus loin, comprenez bien que cette section

409 reflète mes propres expériences, et elle est donc (j'ose le dire)

410 peu objective. Néanmoins, j'ai utilisé les outils de gestion de source

411 listés ci dessous, dans la plupart des cas, pendant plusieurs années.

412 %% TODO: Fussy translation.

413

414 \subsection{Subversion}

415

416 Subversion est un des outils de gestion de source les plus populaire, il fût

417 développé pour remplacer CVS. Il a une architecture client/server centralisée.

418

419 Subversion et Mercurial ont des noms de commandes très similaires pour

420 les mêmes opérations, ainsi si vous êtes familier avec l'un, c'est facile

421 d'apprendre l'autre. Ces deux outils sont portables sur les systèmes

422 d'exploitation les plus populaires\footnote{NdT:Mercurial fonctionne sans problème

423 sur OpenVMS à l'ESME Sudria \url{http://www.esme.fr}, compte tenu que Subversion a été

424 développé en C, je ne suis pas sûr que son portage aurait été aussi aisé.}.

425 %TODO: Backport this statement in english and spanish

426

427 Avant la version 1.5, Subversion n'offrait aucune forme de support pour les fusions. Lors

428 de l'écriture de ce livre, ses capacités de fusion étaient nouvelles, et réputées pour être

429 \href{http://svnbook.red-bean.com/nightly/en/svn.branchmerge.advanced.html#svn.branchmerge.advanced.finalword}{complexes

430 et bugguées}.

431

432 Mercurial dispose d'un avantage substantiel en terme de performance par rapport à

433 Subversion sur la plupart des opérations que j'ai pu tester. J'ai mesuré

434 une différence de performance allant de deux à six fois plus rapide avec

435 le système de stockage de fichier local de Subversion~1.4.3

436 (\emph{ra\_local}), qui est la méthode d'accès la plus rapide disponible. Dans

437 un déploiement plus réaliste, impliquant un stockage réseau, Subversion

438 serait encore plus désavantagé. Parce que la plupart des commandes Subversion

439 doivent communiquer avec le serveur et que Subversion n'a pas de mécanisme

440 de réplication, la capacité du serveur et la bande passante sont devenues des

441 goulots d'étranglement pour les projets de taille moyenne ou grande.

442

443 En outre, Subversion implique une surcharge substantielle dans le stockage local

444 de certaines données, pour éviter des transactions avec le serveur, pour

445 certaines opérations communes, telles que la recherche des fichiers modifiés

446 (\texttt{status}) et l'affichage des modifications par rapport à la révision

447 courante (\texttt{diff}). En conséquence, un répertoire de travail Subversion

448 a souvent la même taille, ou est plus grand, qu'un dépôt Mercurial et son

449 espace de travail, et ceci bien que le dépôt Mercurial contienne l'intégralité

450 de l'historique.

451

452 Subversion est largement supporté par les outils tierces. Mercurial est

453 actuellement encore en retrait de ce point de vue. L'écart se réduit, néanmoins,

454 et en effet certains des outils graphiques sont maintenant supérieurs à leurs

455 équivalents Subversion. Comme Mercurial, Subversion dispose d'un excellent

456 manuel utilisateur.

457

458 Parce que Subversion ne stocke pas l'historique chez ses clients, il est

459 parfaitement adapté à la gestion de projets qui doivent suivre un ensemble

460 de larges fichiers binaires et opaques. Si vous suivez une cinquantaine de

461 versions d'un fichier incompressible de 10MB, l'occupation disque coté client

462 d'un projet sous Subversion restera à peu près constante. A l'inverse,

463 l'occupation disque du même projet sous n'importe lequel des gestionnaires

464 de source distribués grandira rapidement, proportionnellement aux nombres

465 de versions, car les différences entre chaque révisions seront très grandes.

466

467 En outre, c'est souvent difficile ou, généralement, impossible de fusionner

468 des différences dans un fichier binaire. La capacité de Subversion de

469 verrouiller des fichiers, pour permettre à l'utilisateur d'être le seul

470 à le mettre à jour (``commit'') temporairement, est un avantage significatif

471 dans un projet doté de beaucoup de fichiers binaires.

472

473 Mercurial peut importer l'historique depuis un dépôt Subversion. Il peut

474 aussi exporter l'ensemble des révisions d'un projet vers un dépôt Subversion.

475 Ceci rend très facile de ``prendre la température'' et d'utiliser Mercurial et Subversion

476 en parallèle, avant de décider de migrer vers Mercurial. La conversion de

477 l'historique est incrémentale, donc vous pouvez effectuer une conversion

478 initiale, puis de petites additions par la suite pour ajouter les nouvelles

479 modifications.

480

481 \subsection{Git}

482

483 Git est un outil de gestion de source distribué qui fût développé pour gérer

484 le code source de noyau de Linux. Comme Mercurial, sa conception initiale a

485 été inspirée par Monotone.

486

487 Git dispose d'un ensemble conséquent de commandes, avec plus de~139 commandes

488 individuelles pour la version~1.5.0. Il a aussi la réputation d'être difficile

489 à apprendre. Comparé à Git, le point fort de Mercurial est clairement sa

490 simplicité.

491

492 En terme de performance, Git est extrêmement rapide. Dans la plupart des

493 cas, il est plus rapide que Mercurial, tout du moins sur Linux, alors que

494 Mercurial peut être plus performant sur d'autres opérations. Néanmoins, sur

495 Windows, les performances et le niveau de support général fourni par Git,

496 au moment de l'écriture de cet ouvrage, est bien derrière celui de Mercurial.

497

498 Alors que le dépôt Mercurial ne demande aucune maintenance, un dépôt Git

499 exige d'exécuter manuellement et régulièrement la commande ``repacks'' sur

500 ces métadonnées. Sans ceci, les performances de git se dégradent et la

501 consommation de l'espace disque augmente rapidement. Un serveur qui contient

502 plusieurs dépôts Git qui ne sont pas régulièrement et fréquemment ``repacked''

503 deviendra un vrai problème lors des ``backups'' du disque, et il y eu des

504 cas, où un ``backup'' journalier pouvait durer plus de~24 heures. Un dépôt

505 fraichement ``repacked'' sera légèrement plus petit qu'un dépôt Mercurial,

506 mais un dépôt non ``repacked'' est beaucoup plus grand.

507

508 Le cœur de Git est écrit en C. La plupart des commandes Git sont implémentées

509 sous forme de scripts Shell ou Perl, et la qualité de ces scripts varie

510 grandement. J'ai plusieurs fois constaté que certains de ces scripts étaient

511 chargés en mémoire aveuglément et que la présence d'erreurs pouvait s'avérer

512 fatal.

513

514 Mercurial peut importer l'historique d'un dépôt Git.

515

516 \subsection{CVS}

517

518 CVS est probablement l'outil de gestion de source le plus utilisé aujourd'hui

519 dans le monde. À cause de son manque de clarté interne, il n'est plus

520 maintenu depuis plusieurs années.

521

522 Il a une architecture client/serveur centralisée. Il ne regroupe pas les

523 modifications de fichiers dans une opération de ``commit'' atomique, ce

524 qui permet à ses utilisateurs de ``casser le \textit{build}'' assez

525 facilement : une personne peut effectuer une opération de ``commit''

526 sans problème puis être bloquée par besoin de fusion, avec comme conséquence

527 néfaste, que les autres utilisateurs ne récupèreront qu'une partie de ses

528 modifications. Ce problème affecte aussi la manière de travailler avec

529 l'historique du projet. Si vous voulez voir toutes les modifications d'une

530 personne du projet, vous devrez injecter manuellement les descriptions et les

531 \textit{timestamps} des modifications de chacun des fichiers impliqués (si

532 vous savez au moins quels sont ces fichiers).

533

534 CVS a une notion étrange des \textit{tags} et des branches que je n'essayerai

535 même pas de décrire ici. Il ne supporte pas bien les opérations de renommage d'un

536 fichier ou d'un répertoire, ce qui facilite la corruption de son dépôt. Il n'a

537 presque pas pour ainsi dire de contrôle de cohérence interne, il est donc

538 pratiquement impossible de dire si un dépôt est corrompu ni à quel point. Je

539 ne recommanderai pas CVS pour un projet existant ou nouveau.

540

541 Mercurial peut importer l'historique d'un projet CVS. Néanmoins, il y a

542 quelques principes à respecter; ce qui est vrai aussi pour les autres

543 outils d'import de projet CVS. À cause de l'absence de ``commit'' atomique

544 et gestion de version de l'arborescence, il n'est pas possible de reconstruire

545 de manière précise l'ensemble de l'historique. Un travail de ``devinette''

546 est donc nécessaire, et les fichiers renommés ne sont pas détectés. Parce

547 qu'une bonne part de l'administration d'un dépôt CVS est effectuée manuellement,

548 et est donc, sujette à erreur, il est courant que les imports CVS rencontrent

549 de nombreux problèmes avec les dépôt corrompus (des \textit{timestamps}

550 de révision complètement buggés et des fichiers verrouillés depuis des années

551 sont deux des problèmes les moins intéressants dont je me souvienne).

552

553 Mercurial peut importer l'historique depuis un dépôt CVS.

554

555 \subsection{Commercial tools}

556

557 Perforce a une architecture client/serveur centralisée, sans aucun

558 mécanisme de mise en cache de données coté client. Contrairement à la plupart

559 des outils modernes de gestion de source, Perforce exige de ses

560 utilisateurs d'exécuter une commande pour informer le serveur

561 central de tout fichier qu'ils souhaitent modifier.

562

563 Les performances de Perforce sont plutôt bonnes pour des petites

564 équipes, mais elles s'effondrent rapidement lorsque le nombre

565 d'utilisateurs augmente au delà de la douzaine. Des installations

566 de Perforce assez larges nécessitent le déploiement de proxies pour

567 supporter la montée en charge associée.

568

569 \subsection{Choisir un outil de gestion de source}

570

571 A l'exception de CVS, tous les outils listés ci-dessus ont des

572 forces qui leur sont propres et qui correspondent à certaines

573 formes de projet. Il n'y a pas un seul meilleur outil de gestion

574 de source qui correspondrait le mieux à toutes les situations.

575

576 Par exemple, Subversion est un très bon choix lorsqu'on travaille

577 avec beaucoup de fichiers binaires, qui évoluent régulièrement, grâce

578 à sa nature centralisée et sa capacité à verrouiller des fichiers.

579

580 Personnellement, je préfère Mercurial pour sa simplicité, ses

581 performances et sa bonne capacité de fusion, et il m'a très bien rendu service

582 de plusieurs années maintenant.

583

584 \section{Migrer depuis un outil à Mercurial}

585

586 Mercurial est livré avec une extension nommée \hgext{convert}, qui

587 peut de manière incrémentale importer des révisions depuis différents

588 autres outils de gestion de source. Par ``incrémental'', j'entends que

589 vous pouvez convertir l'historique entier du projet en une seule fois,

590 puis relancer l'outil d'import plus tard pour obtenir les modifications

591 effectuées depuis votre import initial.

592

593 Les outils de gestion de source supportés par \hgext{convert} sont :

594 \begin{itemize}

595 \item Subversion

596 \item CVS

597 \item Git

598 \item Darcs

599 \end{itemize}

600

601 En outre, \hgext{convert} peut exporter les modifications depuis Mercurial

602 vers Subversion. Ceci rend possible d'essayer Subversion en parallèle

603 avant de choisir une solution définitive, sans aucun risque de perte de

604 données.

605

606 La commande \hgxcmd{conver}{convert} est très simple à utiliser. Simplement,

607 indiquez le chemin ou l'URL du dépôt de source, en lui indiquant éventuellement

608 le nom du chemin de destination, et la conversion se met en route. Après cet

609 import initial, il suffit de relancer la commande encore une fois pour

610 importer les modifications effectuées depuis.

611

612 %%% Local Variables:

613 %%% mode: latex

614 %%% TeX-master: "00book"

615 %%% End: