git merge 和 git rebese的区别
拉取分支和合并代码会涉及两种选择,git merge 和 git rebase:
- rebase:变基,会有一个干净的分支,但是对于记录来源不够清楚
- merge:合并,git 分支看起来比较混乱,但是清楚各个记录的来源和时间点。
推荐使用 merge:
- 拉取公共分支使用最新代码:merge。rebase,也就是
git pull - r
或git pull --rebase
。这样的好处是,提交记录比较简洁。但有个缺点就是rebase
以后就不知道当前的分支最早从哪个分支拉出来了,因为基底变了。
git pull -r
git pull --rebase
- 往公共分支上合并代码 merge,如果使用 rebase,那么其它开发人员想看主分支的历史,就不是原来的历史了,历史已经被篡改了。举个例子解释下,比如张三和李四从共同的节点拉出来开发,张三先开发完提交了两次然后merge上去了,李四后来开发完如果rebase上去(注意,李四需要切换到自己本地的主分支,假设先pull了张三的最新改动下来,然后执行<git rebase 李四的开发分支>,然后再git push到远端),则李四的新提交变成了张三的新提交的新基底,本来李四的提交是最新的,结果最新的提交显示反而是张三的,就乱套了,以后有问题就不好追溯了。
- 正因如此,
大部分公司其实会禁用rebase
,不管是拉代码还是push代码统一都使用merge,虽然会多出无意义的一条提交记录“Merge … to …”,但至少能清楚地知道主线上谁合了的代码以及他们合代码的时间先后顺序。
git rebase
过程详解
首先我们通过简单的提交节点图解感受一个rebase
- 构造两个分支 master 和 feature,其中feature是在提交点B处从master上拉出来分支
- master上有一个新提交 M,feature上有两个新提交 C 和 D
此时我们切换到feature分支上,执行rebase命令,相当于是想要把master分支合并到feature分支(这一步场景就可以类比为我们在自己的分支上开发了一段时间,准备从主干 master 上拉一下最新改动。模拟了 git pull --rebase
的情形)
# 将 master 上的分支合并到feature
# 这两条命令等价于 git rebase master feature
git checkout feature
git rebase master
下面为变基后的提交节点,解释一下其工作原理:
- feature:待变基分支、当前分支
- master:基分支,目标分支
官方解释:当执行rebase操作时,git 会从两个分支的共同祖先开始提取待变基分支上的修改,然后待变基分支指向基分支的最新提交,最后将刚才提交的修改应用到基分支的最新提交的后面。
结合demo解释:当在feature分支上执行git rebase master时,git会从 master 和 feature 的共同祖先 B 开始提取feature分支上的修改,也就是 C 和 D 两个提交,先提取到。然后将 feature 分支指向 master 分支的最新提交上,也就是 M。最后把提取的 C 和 D 接到 M 后面,注意这里的接法,官方没有说清楚,实际上是依次拿 M 和 C、D的内容分别比较,处理冲突后生成新的 C 和 D。一定注意,这里新C、D和之前的C、D已经不一样了,是我们处理冲突后的新内容,feature 指针自然最后也是指向D。
通俗解释,rebase,变基,可以直接理解为改变基底。feature 分支是基于 master 分支的B拉出来的分支,feature 的基底是B。而 mater 在 B之后有新的提交,就相当于此时要用 master 上的新的提交来作为 feature分支的新基底。实际操作为把B之后feature的提交先暂存下来,然后删掉原来的提交,再找到 mater 的最新提交位置,把存下来的提交再接上去(接上去是逐个和新基底处理冲突的过程),如此feature分支的基底就相当于变成了M而不是原来的B了。(注意,如果master上在B以后没有新提交,那么就还是用原来的B作为基,rebase操作相当于无效,此时和git merge就基本没区别了,差异只在于git merge会多一条记录merge操作的提交记录)
工作场景
上面的例子可抽象为如下实际工作场景:远程库上有一个 master 分支目前开发到B了,张三从B拉了代码到本地的feature分支进行开发,目前提交了两次,开发到D了,李四也从B拉到本地的master分支,他提交到了M,然后合到远程库的master上了,此时张三想从远程库master拉下最新代码,于是他在feature分支上执行了git pull origin master:feature --rebase
(注意要加-rebase参数),即把远程库master分支给rebase下来,由于李四更早开发完,此时远程master上是李四的最新内容,rebase后再看张三的历史提交记录,就相当于是张三是基于李四的最新提交M进行的开发了。(但实际上张三更早拉代码下来,李四拉的晚但提交早)
git merge
git merge有好几种不同的模式。
git merge是开发者做常用的 git 命令之一,默认情况下你直接使用 git merge 命令,没有附加任何选项命令的话,那么应该是交给 git 来判断使用哪种 merge 模式,实际上 git 默认执行的指令是
git merge -ff
指令(默认值)。对于专业的开发者来说,你可能无须每次合并都指定合并模式(如果需要的话还是要指定的),但是你可能需要知道 git 在背后为你默认做了事情,这样才能保证你的代码万无一失。
fast-forward(–ff):master与feature存在公共祖先
开发者小王接到需求任务,从 master 分支中创建功能分支,git 指令如下:
git checkout -b feature556
Switched to a new branch 'feature556'
小王在 feature556 分支上完成的功能开发工作,然后产生1次 commit,
git commit -m 'Create pop up effects'
[feature556 6104106] create pop up effects
3 files changed, 75 insertions(+)
我们再更新一下 README 自述文件,让版本差异更明显一些
git commit -m `updated md`
这时候我们看看当前分支的 git 历史记录,输入 git log --online -all
可以看到全部分支的历史线:
f2c9c7f (HEAD -> feature556) updated md
6104106 create pop up effects
a1ec682 (origin/main, origin/HEAD, main) import dio
c5848ff update this readme
8abff90 update this readme
功能完成后自然要上线,我们把代码合并,完成上线动作,代码如下:
git checkout master
git merge feature556
Updating a1ec682..38348cc
Fast-forward....... | 2+++1 file changed, 2 insertions(+)
如果你注意上面的文字,你会发现 git 帮我们自动执行了 Fast - forward 操作,那什么是 Fast - forward?
Fast-forward 是指 Mater 合并了 Feature 时候发现 Master 当前节点一直和 Feature 的根节点相同,没有发生改变,那么 Master 快速移动头指针到 Feature 的位置,所以 Fast-forward并不会发生真正的合并,只是通过移动指针造成合并的假象,这也体现了 git 设计的巧妙之处。合并后的分支指针如下:
通常功能分支(feature556)合并master后会被删除,通过下图可以看到,通过Fast-forward模式产生的合并可以产生干净并且线性的历史记录:
non-Fats-forward(-no-ff):master与feature不存在公共祖先
什么时候会产生 non-Fast-forward,通常,当合并的分支跟master不存在共同祖先节点的时候,这时候在 merge 的时候 git 默认无法使用 Fast-forward模式。
可以看到master分支已经比feature001快了2个版本,master已经没办法通过移动头指针来完成Fast-forward,所以在master合并feature001的时候就不得不做出真正的合并,真正的合并会让 git 多做很多工作,具体合并的动作如下:
- 找出master和feature001的公共祖先,节点c1,c6,c3三个节点的版本(如果有冲突需要处理)
- 创建新的节点c7,并且将三个版本的差异合并到c7,并且创建commit
- 将master和HEAD指针移动到c7
补充🏡:大家在 git log 看到很多类似:Merge branch 'feature001' into master 的 commit 就是 non-Fast-forward 产生的。
执行完以上动作,最终分支流程图如下:
fast-forward only(-ff-only):尝试-ff方式合并,如果不满足则退出
先简单介绍一下 git merge 的三个合并参数模式:
- -ff 自动合并模式:当合并的分支为当前分支的后代的,那么会自动执行 --ff (Fast-forward) 模式,如果不匹配则执行 --no-ff(non-Fast-forward) 合并模式
- –no-ff 非 Fast-forward 模式:在任何情况下都会创建新的 commit 进行多方合并(及时被合并的分支为自己的直接后代)
- –ff-onlu Fast-forward 模式:只会按照 Fast-forward 模式进行合并,如果不符合条件(并非当前分支的直接后代),则会拒绝合并请求并且退出
三种模式的选择
三种merge模式没有好坏和优劣之分,只有根据需求和实际情况选择合适的合并模式才是最优解
-
如果你是小型团队,并且追求干净线性 git 历史记录,那么我推荐使用 git merge --ff-only 方式保持主线模式开发是一种不错的选择
-
如果你团队不大不小,并且也不追求线性的 git 历史记录,要体现相对真实的 merge 记录,那么默认的 git --ff 比较合适
-
如果你是大型团队,并且要严格监控每个功能分支的合并情况,那么使用 --no-ff 禁用 Fast-forward 是一个不错的选择
区别及推荐
区别
rebase:变基,会有一个干净的分支,但是对于记录来源不够清晰,commit的提交先后顺序也会比较错乱。(rebase以后我就不知道我的当前分支最早是从哪个分支拉出来的了,因为基底变了)
merge(推荐使用):合并,git分支看起来比较混乱,但是清楚各个记录的来源与时间节点
推荐:全部使用merge
拉公共分支使用最新代码:merge;有些公司会要求使用rebase,也就是git pull -r或git pull --rebase。这样的好处很明显,提交记录会比较简洁。但有个缺点就是rebase以后我就不知道我的当前分支最早是从哪个分支拉出来的了,因为基底变了嘛,所以看个人需求了。总体来说,即使是单机也不建议使用。
git fetch git merge --ff-only
往公共分支上合代码merge;如果使用rebase,那么其他开发人员想看主分支的历史,就不是原来的历史了,历史已经被你篡改了。举个例子解释下,比如张三和李四从共同的节点拉出来开发,张三先开发完提交了两次然后merge上去了,李四后来开发完如果rebase上去(注意,李四需要切换到自己本地的主分支,假设先pull了张三的最新改动下来,然后执行<git rebase 李四的开发分支>,然后再git push到远端),则李四的新提交变成了张三的新提交的新基底,本来李四的提交是最新的,结果最新的提交显示反而是张三的,就乱套了,以后有问题就不好追溯了。
正因如此,大部分公司其实会禁用rebase,不管是拉代码还是push代码统一都使用merge,虽然会多出无意义的一条提交记录“Merge … to …”,但至少能清楚地知道主线上谁合了的代码以及他们合代码的时间先后顺序。