7.7 Инструменты Git – Раскрытие тайн reset

Добавлено3 ноября 2021 в 14:27

Перед тем, как перейти к более специализированными утилитам, давайте поговорим о reset и checkout. Когда вы в первый раз сталкиваетесь с этими командами, они кажутся самыми непонятными из всех, что есть в Git. Они делают так много, что попытки по-настоящему их понять и правильно использовать кажутся безнадёжными. Чтобы всё же достичь этого, мы советуем воспользоваться простой аналогией.

Три дерева

Разобраться с командами reset и checkout будет проще, если считать, что Git управляет содержимым трёх различных деревьев. Здесь под «деревом» мы понимаем «набор файлов», а не специальную структуру данных (в некоторых случаях индекс ведет себя не совсем так, как дерево, но для наших текущих целей его проще представлять именно таким).

В своих обычных операциях Git управляет тремя деревьями:

Дерево Назначение
HEAD Снимок последнего коммита, родитель следующего
Индекс Снимок следующего намеченного коммита
Рабочий каталог Песочница

Указатель HEAD

HEAD – это указатель на текущую ветку, которая, в свою очередь, является указателем на последний коммит, сделанный в этой ветке. Это значит, что HEAD будет родителем следующего созданного коммита. Как правило, самое простое – считать HEAD снимком вашего последнего коммита.

На самом деле, довольно легко увидеть, что представляет из себя этот снимок. Ниже приведён пример получения содержимого каталога и контрольных сумм для каждого файла в HEAD:

$ git cat-file -p HEAD
tree cfda3bf379e4f8dba8717dee55aab78aef7f4daf
author Scott Chacon  1301511835 -0700
committer Scott Chacon  1301511835 -0700

initial commit

$ git ls-tree -r HEAD
100644 blob a906cb2a4a904a152...   README
100644 blob 8f94139338f9404f2...   Rakefile
040000 tree 99f1a6d12cb4b6f19...   lib

Команды cat-file и ls-tree являются «служебными» (plumbing) командами, которые используются внутри системы и не требуются в ежедневной работе, но они помогают нам разобраться, что же происходит на самом деле.

Индекс

Индекс – это ваш следующий намеченный коммит. Мы также упоминали это понятие как «область подготовленных изменений» Git – то, что Git просматривает, когда вы выполняете git commit.

Git заполняет индекс списком изначального содержимого всех файлов, выгруженных в последний раз в ваш рабочий каталог. Затем вы заменяете некоторые из таких файлов их новыми версиями, и команда git commit преобразует эти изменения в дерево для нового коммита.

$ git ls-files -s
100644 a906cb2a4a904a152e80877d4088654daad0c859 0	README
100644 8f94139338f9404f26296befa88755fc2598c289 0	Rakefile
100644 47c6340d6459e05787f644c2447d2595f5d3a54b 0	lib/simplegit.rb

Повторим, здесь мы используем служебную команду ls-files, которая показывает, как выглядит ваш индекс сейчас.

Технически, индекс не является древовидной структурой; на самом деле он реализован как сжатый список (flattened manifest) – но для наших целей такого представления будет достаточно.

Рабочий каталог

Наконец, у вас есть рабочий каталог. Два других дерева сохраняют свое содержимое эффективным, но неудобным способом внутри каталога .git. Рабочий каталог распаковывает их в настоящие файлы, что упрощает для вас их редактирование. Считайте Рабочий каталог песочницей, где вы можете опробовать изменения перед их занесением в индекс (область подготовленных изменений) и затем в историю.

$ tree
.
├── README
├── Rakefile
└── lib
    └── simplegit.rb

1 directory, 3 files

Рабочий процесс

Основное предназначение Git – это сохранение снимков последовательно улучшающихся состояний вашего проекта, путём управления этими тремя деревьями.

reset workflow

Давайте рассмотрим этот процесс: пусть вы перешли в новый каталог, содержащий один файл. Данную версию этого файла будем называть v1 и отмечать голубым цветом. Выполним команду git init, которая создаст Git-репозиторий, у которого ссылка HEAD будет указывать на ещё несуществующую ветку (master пока не существует).

reset ex1

На данном этапе только дерево рабочего каталога содержит данные.

Теперь мы хотим закоммитить этот файл, поэтому мы используем git add для копирования содержимого рабочего каталога в индекс.

reset ex2

Затем, мы выполняем команду git commit, которая сохраняет содержимое индекса как неизменяемый снимок, создает объект коммита, который указывает на этот снимок, и обновляет master так, чтобы она тоже указывала на этот коммит.

reset ex3

Если сейчас выполнить git status, то мы не увидим никаких изменений, так как все три дерева одинаковые.

Теперь мы хотим внести изменения в файл и закоммитить его. Мы пройдём через ту же процедуру: сначала мы отредактируем файл в нашем рабочем каталоге. Давайте называть эту версию файла v2 и обозначать красным цветом.

reset ex4

Если мы сейчас выполним git status, то увидим, что этот файл выделен красным в разделе «Изменения, не подготовленные к коммиту», так как его представления в индексе и рабочем каталоге различаются. Затем мы выполним git add для этого файла, чтобы поместить его в индекс.

reset ex5

Если сейчас мы выполним git status, то увидим, что этот файл выделен зелёным цветом в разделе «Изменения, которые будут закоммичены», так как индекс и HEAD различаются – то есть, наш следующий намеченный коммит сейчас отличается от нашего последнего коммита. Наконец, мы выполним git commit, чтобы завершить коммит.

reset ex6

Сейчас команда git status не показывает ничего, так как все три дерева снова одинаковые.

Переключение веток и клонирование проходят через похожий процесс. Когда вы переключаетесь (checkout) на ветку, HEAD начинает также указывать на новую ветку, ваш индекс замещается снимком коммита этой ветки, и затем содержимое индекса копируется в ваш рабочий каталог.

Назначение команды reset

Команда reset становится более понятной, если рассмотреть её с учётом вышеизложенного.

В следующих примерах предположим, что мы снова изменили файл file.txt и закоммитили его в третий раз. Поэтому наша история теперь выглядит так:

reset start

Давайте теперь внимательно проследим, что именно происходит при вызове reset. Эта команда простым и предсказуемым способом управляет тремя деревьями, существующими в Git. Она выполняет три основных операции.

Шаг 1: Перемещение указателя HEAD

Первое, что сделает reset – переместит то, на что указывает HEAD. Обратите внимание, изменяется не сам HEAD (что происходит при выполнении команды checkout); reset перемещает ветку, на которую указывает HEAD. Таким образом, если HEAD указывает на ветку master (то есть вы сейчас работаете с веткой master), выполнение команды git reset 9e5e6a4 сделает так, что master будет указывать на 9e5e6a4.

reset soft

Неважно, с какими опциями вы вызвали команду reset с указанием коммита (reset также можно вызывать с указанием пути), она всегда будет пытаться сперва сделать данный шаг. При вызове reset --soft на этом выполнение команды остановится.

Теперь взгляните на диаграмму и постарайтесь разобраться, что случилось: фактически была отменена последняя команда git commit. Когда вы выполняете git commit, Git создает новый коммит и перемещает на него ветку, на которую указывает HEAD. Если вы выполняете reset на HEAD~ (родителя HEAD), то вы перемещаете ветку туда, где она была раньше, не изменяя при этом ни индекс, ни рабочий каталог. Вы можете обновить индекс и снова выполнить git commit, таким образом добиваясь того же, что делает команда git commit --amend (смотрите «Изменение последнего коммита»).

Шаг 2: Обновление индекса (--mixed)

Заметьте, если сейчас вы выполните git status, то увидите отмеченные зелёным цветом изменения между индексом и новым HEAD.

Следующим, что сделает reset, будет обновление индекса содержимым того снимка, на который указывает HEAD.

reset mixed

Если вы указали опцию --mixed, выполнение reset остановится на этом шаге. Такое поведение также используется по умолчанию, поэтому если вы не указали совсем никаких опций (в нашем случае git reset HEAD~), выполнение команды также остановится на этом шаге.

Снова взгляните на диаграмму и постарайтесь разобраться, что произошло: отменен не только ваш последний commit, но также и добавление в индекс всех файлов. Вы откатились назад до момента выполнения команд git add и git commit.

Шаг 3: Обновление рабочего каталога (--hard)

Третье, что сделает reset – это приведение вашего рабочего каталога к тому же виду, что и индекс. Если вы используете опцию --hard, то выполнение команды будет продолжено до этого шага.

reset hard

Давайте разберемся, что сейчас случилось. Вы отменили ваш последний коммит, результаты выполнения команд git add и git commit, а также все изменения, которые вы сделали в рабочем каталоге.

Важно отметить, что только указание этого флага (--hard) делает команду reset опасной, это один из немногих случаев, когда Git действительно удаляет данные. Все остальные вызовы reset легко отменить, но при указании опции --hard эта команда принудительно перезаписывает файлы в рабочем каталоге. В данном конкретном случае, версия v3 нашего файла всё ещё остаётся в коммите внутри базы данных Git, и мы можем вернуть её, просматривая наш reflog; но если вы не коммитили эту версию, Git перезапишет файл и её уже нельзя будет восстановить.

Резюме

Команда reset в заранее определённом порядке перезаписывает три дерева Git, останавливаясь тогда, когда вы ей скажете:

  1. перемещает ветку, на которую указывает HEAD (останавливается на этом, если указана опция --soft);
  2. делает индекс таким же как и HEAD (останавливается на этом, если не указана опция --hard);
  3. делает рабочий каталог таким же как индекс.

reset с указанием пути

Основной форме команды reset (без опций --soft и --hard) вы также можете передавать путь, с которым она будет работать. В этом случае, reset пропустит первый шаг, а на остальных будет работать только с указанным файлом или набором файлов. Первый шаг пропускается, так как HEAD является указателем и не может ссылаться частично на один коммит, а частично на другой. Но индекс и рабочий каталог могут быть изменены частично, поэтому reset выполняет шаги 2 и 3.

Итак, предположим вы выполнили команду git reset file.txt. Эта форма записи (так как вы не указали ни SHA-1 коммита, ни ветку, ни опций --soft или --hard) является сокращением для git reset --mixed HEAD file.txt, которая:

  1. перемещает ветку, на которую указывает HEAD (будет пропущено);
  2. делает индекс таким же как HEAD (остановится здесь).

То есть фактически она копирует файл file.txt из HEAD в индекс.

reset path1

Это создает эффект отмены индексации файла. Если вы посмотрите на диаграммы этой команды и команды git add, то увидите, что их действия прямо противоположные.

reset path2

Именно поэтому в выводе git status предлагается использовать эту команду для отмены индексации файла (подробности смотрите в «Отмена индексации файла»).

Мы легко можем заставить Git «брать данные не из HEAD», указав коммит, из которого нужно взять версию этого файла. Для этого мы должны выполнить следующее git reset eb43bf file.txt.

reset path3

Можно считать, что,мы фактически вернули в рабочем каталоге содержимое файла к версии v1, выполнили для него git add, а затем вернули содержимое обратно к версии v3 (в действительности все эти шаги не выполняются). Если сейчас мы выполним git commit, то будут сохранены изменения, которые возвращают файл к версии v1, но при этом файл в рабочем каталоге никогда не возвращался к этой версии.

Заметим, что как и команде git add, reset можно указывать опцию --patch для отмены индексации части содержимого. Таким способом вы можете избирательно отменять индексацию или откатывать изменения.

Слияние коммитов

Давайте посмотрим, как, используя вышеизложенное, сделать кое-что интересное – слияние коммитов.

Допустим, у вас есть последовательность коммитов с сообщениями вида «упс», «в работе» и «забыл этот файл». Вы можете использовать reset, чтобы просто и быстро слить их в один (в разделе «Объединение коммитов» главы 7 представлен другой способ сделать то же самое, но в данном примере проще воспользоваться reset).

Предположим, у вас есть проект, в котором первый коммит содержит один файл, второй коммит добавляет новый файл и изменяет первый, а третий коммит снова изменяет первый файл. Второй коммит был сделан в процессе работы, и вы хотите слить его со следующим.

reset squash r1

Вы можете выполнить git reset --soft HEAD~2, чтобы вернуть ветку HEAD на какой-то из предыдущих коммитов (на первый коммит, который вы хотите оставить):

reset squash r2

Затем просто снова выполните git commit:

reset squash r3

Теперь вы можете видеть, что ваша «достижимая» история (история, которую вы впоследствии отправите на сервер), сейчас выглядит так – у вас есть первый коммит с файлом file-a.txt версии v1, и второй, который изменяет файл file-a.txt до версии v3 и добавляет file-b.txt. Коммита, который содержал файл версии v2, не осталось в истории.

Сравнение с checkout

Наконец, вы можете задаться вопросом, в чем же состоит отличие между checkout и reset. Как и reset, команда checkout управляет тремя деревьями Git, и её поведение так же зависит от того, указали ли вы путь до файла или нет.

Без указания пути

Команда git checkout [branch] очень похожа на git reset --hard [branch], в процессе их выполнения все три дерева изменяются так, чтобы выглядеть как [branch]. Но между этими командами есть два важных отличия.

Во-первых, в отличие от reset --hard, команда checkout бережно относится к рабочему каталогу и проверяет, что она не затрагивает файлы, в которых есть изменения. В действительности, эта команда поступает немного умнее – она пытается выполнить в рабочем каталоге простые слияния так, чтобы все файлы, которые вы не изменяли, были обновлены. Команда reset --hard, напротив, просто заменяет всё целиком, не выполняя проверок.

Второе важное отличие заключается в том, как эти команды обновляют HEAD. В то время как reset перемещает ветку, на которую указывает HEAD, команда checkout перемещает сам HEAD так, чтобы он указывал на другую ветку.

Например, пусть у нас есть ветки master и develop, которые указывают на разные коммиты, и мы сейчас находимся на ветке develop (то есть HEAD указывает на неё). Если мы выполним git reset master, сама ветка develop станет ссылаться на тот же коммит, что и master. Если мы выполним git checkout master, то develop не изменится, но изменится HEAD. Он станет указывать на master.

Итак, в обоих случаях мы перемещаем HEAD на коммит A, но важное отличие состоит в том, как мы это делаем. Команда reset переместит также и ветку, на которую указывает HEAD, а checkout перемещает только сам HEAD.

reset checkout

С указанием пути

Другой способ выполнить checkout состоит в том, чтобы указать путь до файла. В этом случае, как и для команды reset, HEAD не перемещается. Эта команда, как и git reset [branch] file, обновляет файл в индексе версией из коммита, но дополнительно она обновляет и файл в рабочем каталоге. То же самое сделала бы команда git reset --hard [branch] file (если бы reset можно было бы так запускать) – это небезопасно для рабочего каталога и не перемещает HEAD.

Также как git reset и git add, команда checkout принимает опцию --patch для того, чтобы позволить вам избирательно откатить изменения содержимого файла по частям.

Заключение

Надеюсь, вы разобрались с командой reset и можете её спокойно использовать. Но, возможно, вы всё ещё немного путаетесь, чем именно она отличается от checkout, и не запомнили всех правил, используемых в различных вариантах вызова.

Ниже приведена памятка того, как эти команды воздействуют на каждое из деревьев. В столбце «HEAD» указывается «REF», если эта команда перемещает ссылку (ветку), на которую указывает HEAD, и «HEAD», если перемещается только сам HEAD. Обратите особое внимание на столбец «Сохранность рабочего каталога»: – если в нем указано «НЕТ», то хорошенько подумайте прежде, чем выполнить эту команду.

  HEAD Индекс Рабочий Каталог Сохранность рабочего каталога
На уровне коммитов
reset --soft [коммит] REF НЕТ НЕТ ДА
reset [коммит] REF ДА НЕТ ДА
reset --hard [коммит] REF ДА ДА НЕТ
checkout [коммит] HEAD ДА ДА ДА
На уровне файлов
reset (коммит) [путь] НЕТ ДА НЕТ ДА
checkout (коммит) [путь] НЕТ ДА ДА НЕТ

Теги

Gitgit checkoutgit resetДля начинающихОбучениеСистемы контроля версий