Come siamo arrivati qui?

Giulio@723: Giulio@723: Giulio@723: Come siamo arrivati qui? Giulio@723: Giulio@723: Giulio@723: Perché il controllo di revisione? Perché Mercurial? Giulio@723: Giulio@724: Il controllo di revisione è il processo tramite il quale si gestiscono molteplici versioni di un pezzo di informazione. Nella sua forma più semplice, questo viene fatto a mano da molte persone, ogni volta che modificano un file e lo salvano con un nuovo nome che contiene un numero più alto del numero della precedente versione. Giulio@724: Giulio@724: Tuttavia, gestire più versioni anche solo di un singolo file è un'operazione propensa a errori, quindi strumenti software per aiutare ad automatizzare questo processo sono stati disponibili da lungo tempo. I primi strumenti automatizzati per il controllo di revisione erano designati ad assistere un singolo utente nella gestione delle revisioni di un singolo file. Nel corso delle ultime decadi, il campo d'azione degli strumenti di controllo di revisione si è ampiamente esteso, e ora sono in grado di gestire un grande numero di file e di aiutare più persone a lavorare insieme. I migliori strumenti di controllo di revisione moderni non hanno alcun problema a fronteggiare gruppi di migliaia di persone che lavorano insieme su progetti composti da centinaia di migliaia di file. Giulio@723: Giulio@723: L'arrivo del controllo di revisione distribuito è relativamente recente, e finora questo nuovo campo è cresciuto grazie alla propensione delle persone a esplorare territorio malamente mappato. Giulio@723: Giulio@724: Sto scrivendo un libro sul controllo di revisione distribuito perché credo che sia una materia importante che merita una guida sul campo. Ho scelto di trattare Mercurial perché è lo strumento più facile con cui conoscere il territorio, e tuttavia è in grado di scalare fino a soddisfare le richieste di ambienti reali e impegnativi dove molti altri strumenti di controllo di revisione si sono dovuti arrendere. Giulio@723: Giulio@723: Giulio@723: Perché usare il controllo di revisione? Giulio@723: Giulio@723: Esiste un certo numero di ragioni per le quali voi o il vostro gruppo potreste voler usare uno strumento automatico per il controllo di revisione su un progetto. Giulio@723: Giulio@723: Giulio@724: Terrà traccia della storia e dell'evoluzione del vostro progetto, così voi non dovete farlo. Per ogni modifica, registrerà informazioni su chi l'ha fatta, perché l'ha fatta, quando è stata fatta e cosa è stato modificato. Giulio@723: Quando state lavorando con altre persone, il software per il controllo di revisione facilita la collaborazione. Per esempio, quando due persone effettuano cambiamenti incompatibili più o meno simultaneamente, il software vi aiuterà a identificare e risolvere questi conflitti. Giulio@723: Può aiutarvi a recuperare dai vostri errori. Se fate una modifica che più tardi si rivela essere un errore, potete ritornare a una versione precedente di uno o più file. In effetti, uno strumento di controllo di revisione davvero buono vi aiuterà a calcolare efficientemente il momento esatto in cui un problema è stato introdotto (si veda FIXME per i dettagli). Giulio@724: Vi aiuterà a lavorare simultaneamente su molteplici versioni del vostro progetto e a gestire gli spostamenti tra una versione e l'altra. Giulio@723: Giulio@723: Giulio@724: La maggior parte di queste ragioni sono ugualmente valide&emdash;almeno in teoria&emdash;sia che lavoriate su un progetto da soli sia che collaboriate insieme a un centianio di altre persone. Giulio@724: Giulio@724: Un aspetto chiave della praticità del controllo di revisione a queste due dimensioni di sviluppo differenti (programmatore solitario e gruppo gigantesco) è come i suoi benefici si confrontano con i suoi costi. Uno strumento di controllo di revisione che sia difficile da capire e usare finirà per imporre un costo piuttosto alto. Giulio@724: Giulio@724: È probabile che un progetto di cinquecento persone collassi sotto il proprio peso quasi immediatamente senza un processo e uno strumento di controllo di revisione. In questo caso, il costo di usare il controllo di revisione potrebbe sembrare difficilmente meritevole di considerazione, dato che senza di esso il fallimento del progetto è quasi garantito. Giulio@724: Giulio@724: D'altra parte, il lavoretto veloce di una singola persona potrebbe sembrare il contesto meno adatto per impiegare uno strumento di controllo di revisione, perché sicuramente il costo di usarne uno deve essere vicino al costo complessivo del progetto. Giusto? Giulio@723: Giulio@723: Mercurial supporta in maniera unica entrambe queste dimensioni di sviluppo. Potete impararne le basi in pochi minuti appena, e grazie al suo basso overhead, potete applicare il controllo di revisione al più piccolo dei progetti con facilità. La sua semplicità significa che non avrete un sacco di concetti astrusi o di sequenze di comandi a competere per il vostro spazio mentale con qualsiasi cosa stiate davvero cercando di fare. Allo stesso tempo, le elevate prestazioni e la natura peer-to-peer di Mercurial vi permetteranno di scalare in maniera indolore per gestire grandi progetti. Giulio@723: Giulio@723: Nessuno strumento di controllo di revisione può salvare un progetto gestito male, ma una buona scelta di strumenti può fare una notevole differenza nella fluidità con cui potete lavorare su un progetto. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: I molti nomi del controllo di revisione Giulio@723: Giulio@724: Il controllo di revisione è un campo talmente vario che ci si riferisce spesso attraverso numerosi nomi e acronimi. Ecco alcune delle variazioni più comuni che incontrerete: Giulio@723: Giulio@724: controllo di revisione (RCS) Giulio@724: gestione della configurazione del software (SCM), o gestione della configurazione Giulio@724: gestione del codice sorgente Giulio@724: controllo del codice sorgente, o controllo dei sorgenti Giulio@724: controllo di versione (VCS) Giulio@723: Giulio@723: Alcune persone affermano che questi termini in realtà abbiano significati differenti, ma in pratica si sovrappongono così tanto che non c'è alcun modo concordato o persino utile di distinguerli. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: A proposito degli esempi in questo libro Giulio@723: Giulio@724: Questo libro tratta gli esempi di codice in maniera inusuale. Tutti gli esempi sono vivi&emdash;ognuno di essi è in effetti il risultato di uno script di shell che esegue i comandi Mercurial che vedete. Ogni volta che un'immagine del libro viene costruita dai suoi sorgenti, tutti gli script di esempio vengono automaticamente eseguiti e i loro risultati correnti vengono confrontati con i loro risultati attesi. Giulio@724: Giulio@724: Il vantaggio di questo approccio è che gli esempi sono sempre accurati, in quanto descrivono esattamente il comportamento della versione di Mercurial menzionata sulla copertina del libro. Se aggiorno la versione di Mercurial che sto documentando, e il risultato di qualche comando cambia, il processo di costruzione del libro fallisce. Giulio@724: Giulio@724: C'è un piccolo svantaggio in questo approccio, cioè che le date e gli orari che vedete negli esempi tendono a venire schiacciati insieme in modo anomalo, diversamente da quanto accadrebbe se gli stessi comandi venissero digitati da un essere umano. Laddove un essere umano non può inviare più di un comando ogni pochi secondi, le cui marcature temporali sarebbero analogamente intervallate, i miei script d'esempio automatizzati sono in grado di eseguire molti comandi in un secondo. Giulio@724: Giulio@724: Come conseguenza di questo fatto, potrebbe sembrare che molti commit consecutivi siano occorsi durante lo stesso secondo. Potete vedere questo capitare nell'esempio di bisezione in FIXME , per esempio. Giulio@723: Giulio@723: Quindi mentre leggete gli esempi non date troppo peso alle date e agli orari che vedete nell'uscita dei comandi. Ma potete decisamente fidarvi che il comportamento che vedete è consistente e riproducibile. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: Le tendenze nel campo Giulio@723: Giulio@723: Ci sono state alcune inconfondibili tendenze nello sviluppo e nell'utilizzo degli strumenti di controllo di revisione nelle ultime quattro decadi, man mano che le persone hanno acquisito familiarità con le capacità dei loro strumenti e sono state vincolate dalle loro limitazioni. Giulio@723: Giulio@724: La prima generazione ha cominciato col gestire singoli file su singoli computer. Sebbene questi strumenti rappresentassero un enorme avanzamento rispetto al controllo di revisione manuale effettuato ad hoc, il loro modello di locking (bloccaggio) e l'affidamento su di un singolo computer limitarono il loro impiego a piccoli gruppi strettamente uniti. Giulio@723: Giulio@723: La seconda generazione ha rilassato questi vincoli spostandosi su architetture di rete e gestendo interi progetti alla volta. Man mano che i progetti diventarono grandi, gli strumenti incontrarono nuovi problemi. Con i client bisognosi di parlare con i server molto frequentemente, la scalabilità dei server divenne un problema per progetti di grandi dimensioni. Una connessione di rete inaffidabile poteva impedire agli utenti remoti di essere in grado di parlare al server del tutto. Man mano che i progetti open source cominciarono a rendere l'accesso in sola lettura disponibile a chiunque in forma anonima, persone senza privilegi di commit scoprirono che non potevano usare gli strumenti per interagire con un progetto in un modo naturale, in quanto non erano in grado di registrare le modifiche da loro effettuate. Giulio@723: Giulio@723: La generazione attuale degli strumenti di controllo di revisione è di natura peer-to-peer. Tutti questi sistemi hanno abbandonato la dipendenza da un singolo server centrale e permettono alle persone di distribuire i propri dati del controllo di revisione laddove sono effettivamente necessari. La collaborazione attraverso Internet non è più vincolata dalla tecnologia, ma è diventata una questione di scelta e consenso. Gli strumenti moderni possono operare offline indefinitamente e autonomamente, utilizzando una connessione di rete solo quando c'è bisogno di sincronizzare i cambiamenti con un altro repository. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Alcuni vantaggi del controllo di revisione distribuito Giulio@723: Giulio@724: Sebbene gli stumenti per il controllo di revisione distribuito si siano mantenuti per diversi anni robusti e usabili tanto quanto le loro controparti delle generazioni precedenti, questo non vuol dire che le persone che utilizzavano strumenti più vecchi si siano necessariamente accorte dei loro vantaggi. Ci sono diversi modi in cui gli strumenti distribuiti brillano rispetto a quelli centralizzati. Giulio@724: Giulio@724: Per un singolo sviluppatore, gli strumenti distribuiti sono quasi sempre più veloci di quelli centralizzati. Questo avviene per una semplice ragione: uno strumento centralizzato ha bisogno di utilizzare la rete per molte operazioni comuni, perché la maggior parte dei metadati sono memorizzati in una singola copia sul server centrale. Uno strumento distribuito memorizza tutti i suoi metadati localmente. A parità di altre condizioni, utilizzare la rete aggiunge un overhead a uno strumento centralizzato. Non sottostimate il valore di uno strumento veloce e reattivo: vi troverete a passare molto tempo interagendo con il vostro software di controllo di revisione. Giulio@724: Giulio@724: Gli strumenti distribuiti sono indifferenti alle stravaganze dell'infrastruttura dei vostri server, sempre perché replicano i metadati in così tanti luoghi. Se usate un sistema centralizzato e il vostro server si guasta, fareste meglio a sperare che il vostro sistema di backup sia affidabile e che il vostro ultimo backup sia recente ed effettivamente funzionante. Con uno strumento distribuito, avete molti backup disponibili sui computer di ogni singolo collaboratore. Giulio@723: Giulio@723: L'affidabilità della vostra rete influenzerà gli strumenti distribuiti molto meno rispetto a quelli centralizzati. Non potete nemmeno usare uno strumento centralizzato senza una connessione di rete, a parte alcuni comandi altamente vincolati. Con uno strumento distribuito, potreste persino non notare se la vostra connessione di rete cade mentre state lavorando. L'unica cosa che non sarete in grado di fare è comunicare con i repository su altri computer, qualcosa che è relativamente raro rispetto alle operazioni locali. Questo potrebbe essere significativo solo se avete un gruppo di collaboratori sparso in luoghi lontani. Giulio@723: Giulio@723: Giulio@723: Vantaggi per i progetti open source Giulio@723: Giulio@724: Se siete affascinati da un progetto open source e decidete che vi piacerebbe cominciare a lavorarci sopra, e quel progetto usa uno strumento distribuito di controllo di revisione, siete immediatamente alla pari con il gruppo di persone che si considerano il cuore di quel progetto. Se loro pubblicano il proprio repository, potete immediatamente copiare la loro cronologia del progetto, cominciare a effettuare modifiche e registrare il vostro lavoro utilizzando gli stessi strumenti allo stesso modo dei membri del gruppo. Al contrario, con uno strumento centralizzato, siete costretti a usare il software in modalità di sola lettura a meno che qualcuno non vi conceda il permesso di effettuare il commit dei vostri cambiamenti al loro server centrale. Fino a quel momento, non sarete in grado di registrare i cambiamenti e le vostre modifiche rischieranno di venire corrotte ogni volta che provate ad aggiornare la vista del repository dal vostro client. Giulio@723: Giulio@723: Giulio@723: Il falso problema del forking Giulio@723: Giulio@723: È stato suggerito che gli strumenti per il controllo di revisione distribuito espongano i progetti open source a un certo tipo di rischio in quanto rendono facile biforcare lo sviluppo di un progetto. Un fork capita quando ci sono differenze di opinione o di attitudine tra gruppi di sviluppatori che li portano a decidere di non poter lavorare insieme più a lungo. Ogni parte prende una copia più o meno completa del codice sorgente del progetto e prosegue per la propria strada. Giulio@723: Giulio@724: Talvolta le parti di un fork decidono di riconciliare le loro differenze. Con uno strumento centralizzato di controllo di revisione, il processo tecnico di riconciliazione è doloroso e deve essere in gran parte effettuato a mano. Dovete decidere quale cronologia delle revisioni dovrà prevalere e introdurvi in qualche modo i cambiamenti dell'altro gruppo. Di solito, questo risulta nella perdita parziale o completa della cronologia delle revisioni di una delle due parti. Giulio@724: Giulio@724: Quello che gli strumenti distribuiti fanno rispetto alla biforcazione è che rendono la biforcazione l'unico modo per sviluppare un progetto. Ogni singolo cambiamento effettuato è un potenziale punto di biforcazione. La grande forza di questo approccio è che uno strumento per il controllo di revisione distribuito deve essere davvero bravo a unire due fork, perché i fork sono assolutamente fondamentali: vengono effettuati in ogni momento. Giulio@724: Giulio@724: Se ogni frammento di lavoro che tutti fanno, in ogni momento, viene concepito in termini di biforcazioni e unioni, allora ciò che il mondo open source chiama fork diventa un problema puramente sociale. Se gli strumenti distribuiti fanno qualcosa, quello che fanno è ridurre la probabilità di un fork: Giulio@723: Giulio@724: eliminano la distinzione sociale imposta dagli strumenti centralizzati, cioè quella tra le persone all'interno del gruppo con i permessi di commit e le persone all'esterno del gruppo, senza tali permessi. Giulio@724: rendono più facile riconciliarsi dopo un fork sociale, perché l'unica cosa che viene coinvolta dal punto di vista del software di controllo di revisione è semplicemente un'altra unione. Giulio@723: Giulio@723: Giulio@724: Alcune persone oppongono resistenza agli strumenti distribuiti perché vogliono mantenere uno stretto controllo sui propri progetti e credono che gli strumenti centralizzati diano loro questo controllo. Tuttavia, se siete tra quelli che credono a questo, e il vostro repository CVS o Subversion è disponibile pubblicamente, esistono un sacco di strumenti che possono estrarre l'intera storia del vostro progetto (sebbene lentamente) e ricrearla da qualche altra parte al di là del vostro controllo. Quindi non solo il vostro controllo in questo caso è illusorio, ma state rinunciando alla possibilità di collaborare fluidamente con chiunque si senta in dovere di duplicare la storia del vostro progetto. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: Vantaggi per i progetti commerciali Giulio@723: Giulio@724: Molti progetti commerciali vengono intrapresi da gruppi che sono dispersi attraverso il globo. I collaboratori lontani da un server centrale vedranno un'esecuzione dei comandi più lenta e forse una minore affidabilità. I sistemi commerciali di controllo di revisione tentano di mitigare questi problemi tramite componenti aggiuntivi per la replicazione di siti remoti che sono tipicamente costosi da comprare e intrattabili da amministrare. Un sistema distribuito non soffre di questi problemi in prima istanza. Ancora meglio, potete facilmente configurare multipli server autoritari, diciamo uno per ogni sito, in modo che non ci siano comunicazioni ridondanti tra i repository durante i costosi collegamenti di rete a grande distanza. Giulio@724: Giulio@724: I sistemi centralizzati per il controllo di revisione tendono ad avere una scalabilità relativamente bassa. Non è inusuale per un costoso sistema centralizzato cadere sotto il carico combinato di una sola dozzina di utenti concorrenti. Ancora una volta, la tipica risposta tende a essere un dispositivo di replicazione costoso e macchinoso. Dato che il carico su un server centrale&emdash;sempre che ne abbiate uno&emdash;è molto più basso con uno strumento distribuito (perché tutti i dati sono replicati ovunque), un singolo server economico può gestire i bisogni di un gruppo di lavoro molto più grande e la replicazione per il bilancio del carico diventa una semplice questione di scripting. Giulio@724: Giulio@724: I vostri impiegati potranno beneficiare del controllo di versione distribuito anche quando stanno risolvendo un problema nella sede di un cliente. Gli strumenti permetteranno loro di generare versioni personalizzare del software nel repository, provare soluzioni differenti isolandole l'una dall'altra e cercare in maniera efficiente attraverso la cronologia delle revisioni le sorgenti di bug e regressioni nell'ambiente del cliente, il tutto senza aver bisogno di collegarsi alla rete della vostra azienda. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: Perché scegliere Mercurial? Giulio@723: Giulio@723: Mercurial possiede un insieme di caratteristiche unico che lo rende una scelta particolarmente buona come sistema di controllo di revisione. Giulio@723: Giulio@723: È facile da imparare e usare. Giulio@723: È leggero. Giulio@723: Scala in maniera eccellente. Giulio@723: È facile da personalizzare. Giulio@723: Giulio@723: Giulio@723: Se avete una vaga familiarità con i sistemi di controllo di revisione, dovreste essere in grado di cominciare a usare Mercurial in meno di cinque minuti. Anche se non è così, non vi ci vorrà più di qualche altro minuto. L'insieme di comandi e caratteristiche di Mercurial è generalmente uniforme e consistente, così potete tenere a mente alcune regole generali piuttosto che una schiera di eccezioni. Giulio@723: Giulio@723: Su un piccolo progetto, potete cominciare a lavorare con Mercurial in pochi momenti. Creare nuove modifiche e rami di sviluppo; trasferire cambiamenti in giro (sia localmente che attraverso la rete); e le operazioni di stato e cronologia sono tutte veloci. Mercurial tenta di essere agile e non starvi tra i piedi combinando un basso overhead cognitivo con operazioni fulmineamente veloci. Giulio@723: Giulio@723: L'utilità di Mercurial non si limita ai piccoli progetti: è usato da progetti con centinaia di migliaia di collaboratori, ognuno contenente decine di migliaia di file e centinaia di megabyte di codice sorgente. Giulio@723: Giulio@724: Se le funzionalità principali di Mercurial non sono sufficienti per voi, è facile aggiungere. Mercurial è molto adatto alla programmazione delle proprie operazioni, e la sua pulita implementazione in Python rende facile aggiungere funzionalità sotto forma di estensioni. Esistono già un certo numero di estensioni utili e popolari, che spaziano dal supporto alla identificazione dei bug al miglioramento delle prestazioni. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Un confronto tra Mercurial e altri strumenti Giulio@723: Giulio@724: Prima di proseguire, vi prego di tenere a mente che questa sezione riflette necessariamente la mia esperienza, i miei interessi e (oserei dire) i miei pregiudizi. Ho usato tutti i sistemi di controllo di revisione qui elencati, in più casi per diversi anni alla volta. Giulio@723: Giulio@723: Giulio@723: Subversion Giulio@723: Giulio@723: Subversion è un sistema di controllo di revisione piuttosto popolare, sviluppato per sostituire CVS. Ha un'architettura client/server centralizzata. Giulio@723: Giulio@724: Subversion e Mercurial hanno comandi con nomi simile per effettuare le stesse operazioni, così se avete familiarità con uno dei due è facile imparare a usare l'altro. Entrambi gli strumenti sono portabili su tutti i sistemi operativi più popolari. Giulio@724: Giulio@724: Prima della versione 1.5, Subversion non aveva alcun supporto utile per le unioni. Al momento della scrittura, la sua funzionalità per il tracciamento delle unioni è nuova e nota per essere complicata e difettosa. Giulio@723: Giulio@724: Mercurial ha un sostanzioso vantaggio in termini di prestazioni rispetto a Subversion per tutte le operazioni di controllo di revisione di cui ho effettuato il benchmark. Il suo vantaggio si misura in un intervallo che va da un fattore di due a un fattore di sei quando lo si confronta con il file store ra_local di Subversion 1.4.3, che è il metodo di accesso più veloce disponibile. In situazioni più realistiche che coinvolgono uno store basato su rete, Subversion sconterà uno svantaggio sostanzialmente più consistente. Dato che molti comandi di Subversion devono comunicare con il server e Subversion non è dotato di meccanismi utili di replicazione, la capacità del server e la banda di rete diventano colli di bottiglia per progetti di dimensioni moderate. Giulio@724: Giulio@724: In più, Subversion si espone a un sostanziale overhead di storage per evitare transazioni di rete per alcune operazioni comuni, come trovare i file modificati (status) e visualizzare le modifiche rispetto alla revisione corrente (diff). Come risultato, una copia di lavoro di un repository Subversion è spesso della stesse dimensioni, se non più grande, di un intero repository Mercurial più la sua directory di lavoro, anche nel caso in cui il repository Mercurial contenga la cronologia completa del progetto. Giulio@724: Giulio@724: Subversion è ampiamente supportato da strumenti di terze parti. Mercurial è considerevolmente indietro in quest'area. Il divario si sta assottigliando, tuttavia, e in effetti alcuni degli strumenti di interfaccia grafica di Mercurial attualmente offuscano i loro equivalenti per Subversion. Come Mercurial, Subversion è dotato di un eccellente manuale d'uso. Giulio@723: Giulio@723: Dato che Subversion non memorizza la cronologia di revisione sul client, è molto adatto a gestire progetti che hanno a che fare con numerosi file binari opachi di grandi dimensioni. Se effettuate il check in di cinquanta revisioni di un file incomprimibile di 10MB, l'utilizzo di spazio sul lato client da parte di Subversion rimarrà costante. Lo spazio usato da qualunque SCM distribuito crescerà rapidamente in proporzione al numero delle revisioni, perché le differenze tra una revisione e l'altra sono grandi. Giulio@723: Giulio@724: In più, è spesso difficile o, più tipicamente, impossibile unire differenti versioni di un file binario. L'abilità di Subversion di permettere a un utente di bloccare un file, in modo da ottenere temporaneamente i diritti esclusivi per effettuarvi camabiamenti, può essere un vantaggio significativo in progetti dove file binari vengono largamente utilizzati. Giulio@724: Giulio@724: Mercurial può importare la cronologia delle revisioni da un repository Subversion. Può anche esportare la propria cronologia delle revisioni verso un repository Subversion. Questa caratteristica rende facile sentire l'acqua utilizzando Mercurial e Subverison in parallelo prima di decidere di cambiare. La conversione della cronologia è incrementale, così potete effettuare una conversione iniziale, poi piccole conversioni aggiuntive successivamente per introdurre nuovi cambiamenti. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Git Giulio@723: Giulio@723: Git è uno strumento per il controllo di revisione distribuito che è stato sviluppato per gestire l'albero dei sorgenti del kernel di Linux. Come Mercurial, il suo design iniziale è stato in qualche modo influenzato da Monotone. Giulio@723: Giulio@723: Git ha un insieme di comandi piuttosto ampio, con la versione 1.5.0 che fornisce 139 comandi individuali. Si è fatto una certa reputazione di essere difficile da imparare. Rispetto a Git, Mercurial pone una maggiore attenzione alla semplicità. Giulio@723: Giulio@723: In termini di prestazioni, Git è estremamente veloce. In molti casi, è più veloce di Mercurial, almeno sotto Linux, mentre Mercurial è più prestante in altre operazioni. Tuttavia, sotto Windows, le prestazioni e il livello generale di supporto offerto da Git sono, al momento della scrittura, molto più indietro rispetto a Mercurial. Giulio@723: Giulio@724: Mentre un repository Mercurial non ha bisogno di alcuna manutenzione, un repository Git richiede frequenti reimpacchettamenti manuali dei propri metadati. Senza questi, le prestazioni degradano e l'utilizzo di spazio cresce rapidamente. Un server che contiene molti repository Git che non vengono rigorosamente e frequentemente reimpacchettati diventerà pesantemente legato al disco durante i backup, e ci sono state istanze di backup giornalieri che hanno impiegato molto più di 24 ore come risultato. Un repository Git appena impacchettato è leggermente più piccolo di un repository Mercurial, ma un repository non impacchettato ha dimensioni maggiori di diversi ordini di grandezza. Giulio@724: Giulio@724: Il cuore di Git è scritto in C. Molti comandi di Git sono implementati come script di shell o in linguaggio Perl e la qualità di questi script varia grandemente. Ho incontrato diversi casi in cui gli script proseguivano ciecamente la propria esecuzione in presenza di errori che avrebbero dovuto essere fatali. Giulio@723: Giulio@723: Mercurial può importare la cronologia di revisione da un repository Git. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: CVS Giulio@723: Giulio@723: CVS è probabilmente lo strumento di controllo di revisione più largamente usato nel mondo. A causa della sua età e della sporcizia interna, è stato mantenuto solo alla leggera per molti anni. Giulio@723: Giulio@724: Ha un'architettura client/server centralizzata. Non raggruppa cambiamenti di file correlati in commit atomici, rendendo facile alle persone di guastare il software: una persona può effettuare con successo il commit di parte di un cambiamento e poi essere bloccata dalle necessità di un'unione, causando altre persone di vedere solo una porzione del lavoro che intendevano fare. Questo influisce anche su come si lavora con la cronologia del progetto. Se volete vedere tutte le modifiche che qualcuno ha effettuato come parte di un task, dovrete ispezionare manualmente le descrizioni e le marcature temporali dei cambiamenti fatti a ogni file coinvolto (sempre che sappiate quali fossero quei file). Giulio@723: Giulio@723: CVS ha una nozione confusa di etichette e rami di lavoro che non cercherò nemmeno di descrivere. Non supporta per bene il rinominare file o directory, rendendo facile corrompere un repository. Non ha quasi alcuna funzionalità per il controllo della consistenza interna, quindi tipicamente non è nemmeno possibile dire se un repository è corrotto. Non raccomanderei CVS per alcun progetto, nuovo o esistente. Giulio@723: Giulio@724: Mercurial può importare la cronologia di revisione da CVS. Tuttavia, ci sono alcune avvertenze da considerare; queste sono valide anche per qualsiasi altro strumento di controllo di revisione che importi da CVS. A causa della mancanza di cambiamenti atomici in CVS e mancanza di versioni per la gerarchia del filesystem, non è possibile ricostruire la cronologia di CVS in maniera completa e accurata; alcune supposizioni sono coinvolte, e le rinominazioni di solito non verranno mostrate. Dato che buona parte dell'amministrazione avanzata di CVS deve essere fatta a mano e quindi è propensa a errori, è comune per gli importatori di CVS incorrere in problemi multipli con repository corrotti (marcature temporali completamente fasulle per le revisioni e file che sono rimasti bloccati per più di un decennio sono solo due dei problemi meno interessanti che posso ricordare dalla mia esperienza personale). Giulio@723: Giulio@723: Mercurial può importare la cronologia di revisione da un repository CVS. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Strumenti commerciali Giulio@723: Giulio@723: Perforce ha un'architettura client/server centralizzata, senza alcuna memorizzazione dei dati sul lato client. A differenza degli strumenti di controllo di revisione moderni, Perforce richiede che l'utente lanci un comando per comunicare al server di voler modificare un file qualsiasi. Giulio@723: Giulio@724: Le prestazioni di Perforce sono piuttosto buone per piccoli gruppi di lavoro, ma decadono rapidamente man mano che il numero di utenti cresce oltre le poche dozzine. Installazioni di Perforce di modeste dimensioni richiedono l'utilizzo di proxy per fronteggiare il carico generato dai propri utenti. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Scegliere uno strumento di controllo di revisione Giulio@723: Giulio@724: Con l'eccezione di CVS, tutti gli strumenti elencati sopra hanno qualità uniche che li rendono adatti a particolari stili di lavoro. Non esiste un singolo strumento di controllo di revisione che sia il migliore in tutte le situazioni. Giulio@723: Giulio@723: Per fare un esempio, Subversion è una buona scelta per lavorare con file binari frequentemente modificati, a causa della sua natura centralizzata e del supporto per il locking dei file. Giulio@723: Giulio@724: Personalmente trovo che le caratteristiche di Mercurial come la semplicità, le prestazioni, e un buon supporto per le unioni, siano una combinazione irresistibile che mi ha servito bene per diversi anni. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Giulio@723: Passare da un altro strumento a Mercurial Giulio@723: Giulio@724: Mercurial viene distribuito con una estensione chiamata convert, che può importare incrementalmente la cronologia delle revisioni da diversi altri strumenti per il controllo di revisione. Con incrementale voglio dire che potete convertire tutta la cronologia di un progetto in un'unica seduta, poi rieseguire la conversione più tardi per ottenere i nuovi cambiamenti che sono avvenuti dopo la conversione iniziale. Giulio@723: Giulio@723: Gli strumenti di controllo di revisione supportati da convert sono i seguenti: Giulio@723: Giulio@723: Subversion Giulio@723: CVS Giulio@723: Git Giulio@723: Darcs Giulio@723: Giulio@723: In più, convert può esportare i cambiamenti da Mercurial a Subversion. Questo rende possibile provare Subversion e Mercurial in parallelo prima di impegnarsi nel passaggio, senza rischiare di perdere il proprio lavoro. Giulio@723: Giulio@723: Il comando convert è facile da usare. Puntatelo semplicemente al percorso o all'URL di un repository sorgente, dategli opzionalmente il nome di un repository destinazione, e comincerà a lavorare. Dopo la conversione iniziale, vi basta eseguire ancora lo stesso comando per importare i nuovi cambiamenti. Giulio@723: Giulio@723: Giulio@723: Giulio@723: Una breve storia del controllo di revisione Giulio@723: Giulio@723: Il più noto tra i vecchi strumenti per il controllo di revisione è SCCS (acronimo di Source Code Control System, sistema per il controllo del codice sorgente), che Marc Rochkind scrisse ai laboratori Bell nei primi anni '70. SCCS operava su singoli file, e obbligava ogni persona che lavorasse su un progetto ad avere accesso a uno spazio di lavoro condiviso su un singolo sistema. Solo una persona alla volta poteva modificare un file; l'arbitraggio per l'accesso ai file era realizzato attraverso i lock. Era comune per le persone di bloccare i file e dimenticarsi di sbloccarli più tardi, impedendo a chiunque altro di modificare quei file senza l'aiuto di un amministratore. Giulio@723: Giulio@723: Walter Tichy sviluppò un'alternativa free a SCCS nei primi anni '80; chiamò il suo programma RCS (acronimo di Revision Control System, sistema per il controllo di revisione). Come SCCS, RCS obbligava gli sviluppatori a lavorare in un singolo spazio di lavoro condiviso, e a bloccare i file per prevenire cambiamenti simultanei da parte di più persone. Giulio@723: Giulio@724: Più tardi negli anni '80, Dick Grune usò RCS come componente di base per un insieme di script shell che chiamò inizialmente cmt, ma che poi rinominò CVS (acronimo di Concurrent Versions System, sistema di versioni concorrenti). La grande innovazione di CVS fu che permetteva agli sviluppatori di lavorare simultaneamente e in qualche modo indipendentemente nel loro spazio di lavoro personale. Gli spazi di lavoro personali evitavano agli sviluppatori di pestarsi i piedi tutte le volte, come capitava comunemente con SCCS e RCS. Ogni sviluppatore aveva la copia di ogni file nel progetto, e poteva modificare le proprie copie indipendentemente. Era necessario combinare le singole modifiche prima di introdurre i cambiamenti nel repository centrale. Giulio@724: Giulio@724: Brian Berliner prese gli script originali di Grune e li riscrisse in C, rilasciando nel 1989 il codice che fin da allora è stato sviluppato come la moderna versione di CVS. CVS successivamente acquisì l'abilità di operare attraverso una connessione di rete, che gli conferì la propria architettura client/server. L'architettura di CVS è centralizzata; solo il server ha la copia della cronologia del progetto. Gli spazi di lavoro sui client contengono solamente copie delle versioni recenti dei file del progetto e i metadati che servono per conoscere la locazione del server. CVS ha avuto un enorme successo; probabilmente è il sistema di controllo di revisione più largamente utilizzato al mondo. Giulio@723: Giulio@723: All'inizio degli anni '90, Sun Microsystems sviluppò un primo sistema per il controllo di revisione distribuito chiamato TeamWare. Uno spazio di lavoro in TeamWare contiene una copia completa della cronologia del progetto. TeamWare non possiede alcuna nozione di un repository centrale. (CVS si basava su RCS per lo storage della cronologia; TeamWare usava SCCS.) Giulio@723: Giulio@724: Durante gli anni '90 crebbe la consapevolezza di un certo numero di problemi con CVS. Registra individualmente cambiamenti simultanei a file multipli, invece di raggrupparli insieme come una singola operazione logicamente atomica. Non gestisce bene la sua gerarchia di file; è facile incasinare un repository cambiando i nomi di file e directory. Ancora peggio, il suo codice sorgente è difficile da leggere e da mantenere, il che rese proibitiva la soglia di dolore nel correggere questi problemi architetturali. Giulio@723: Giulio@723: Nel 2001, Jim Blandy e Karl Fogel, due sviluppatori che avevano lavorato su CVS, diedero vita a un progetto per rimpiazzarlo con uno strumento che avrebbe avuto una migliore architettura e un codice più pulito. Il risultato, Subversion, non si allontana dal modello client/server centralizzato di CVS, ma aggiunge commit atomici per file multipli, una miglior gestione degli spazi di nomi e un certo numero di altre caratteristiche che lo rendono uno strumento generalmente migliore di CVS. Dal suo rilascio iniziale, la sua popolarità è rapidamente cresciuta. Giulio@723: Giulio@724: Più o meno simultaneamente, Graydon Hoare cominciò a lavorare su un ambizioso sistema di controllo di reversione distribuito che chiamò Monotone. Mentre Monotone risolve molti dei problemi di progettazione di CVS e possiede un'architettura peer-to-peer, va oltre ai primi (e ai successivi) strumenti di controllo di revisione in un certo numero di modi innovativi. Usa hash crittografici come identificatori e ha una nozione integrale di trust per il codice che proviene da sorgenti differenti. Giulio@723: Giulio@723: Mercurial nacque nel 2005. Mentre alcuni aspetti della sua progettazione sono influenzati da Monotone, Mercurial si concentra su facilità d'uso, prestazioni elevate e scalabilità verso progetti molto grandi. Giulio@723: Giulio@723: