大道至简,知易行难
广阔天地,大有作为

SVN2GIT之路(二)SVN到Git的手工迁移(保留所有分支、Tag及提交记录)

系列文章:

SVN2GIT之路(一)引言

对于实际的存量项目而言,从SVN迁移到Git时是必须保留分支、Tag及提交记录的,以下以Bitbucket为例总结某个实际SVN代码仓库迁移到Git代码仓库的全过程。

一、建立SVN用户到Git用户的映射文件userinfo.txt

根据官网的文档:

在Subversion中,每一个人提交时都需要在系统中有一个用户,它会被记录在提交信息内。如果想要将Subversion用户映射到一个更好的Git作者数据中,你需要一个Subversion用户到Git用户的映射。

我们可以在对应SVN管理的工程文件夹下,使用如下命令获取到某个文件夹下所有提交者的名字:

这会将SVN的提交技术输出为XML格式,然后提取出作者信息,再重定向到userinfo.txt文件中。请注意:
1、由于用到grep、sort、awk,因此在Windows环境中需要在bash中运行,如果没有的话先安装Git即可;
2、需要安装svn的命令号工具,如果没有的话需要安装下:

SVN命令行工具

SVN命令行工具

得到的userinfo.txt文件只包含了提交者,形如:

导出SVN提交者

导出SVN提交者

接下来需要按照如下的格式完成映射:

SVN与Git用户映射

SVN与Git用户映射

二、使用git svn clone克隆一个包含了trunk、branches和tags的完整SVN代码仓库

一个典型的SVN仓库(该项目代号为eisp-eipsc-parent)形如:

一个典型的SVN仓库

一个典型的SVN仓库

我们使用如下命令进行克隆(首次执行时会被提示输入SVN的用户名):

其中:
参数–authors-file表示SVN账号映射到Git账号的文件,所有的SVN提交者都要做映射;
参数–trunk表示主干所在目录;
参数–branches表示分支所在目录;
参数–tags表示标签所在目录;
参数–no-metadata表示不导出SVN元数据;当想要将Git仓库中的提交镜像回原SVN仓库中时,需要保留元数据。
参数–no-minimize-url表示不尝试读取上级目录;

git svn clone

git svn clone

如果不使用–no-minimize-url,则可能会导致在clone时扫描不正确的路径(Using higer level of URL):

不使用--no-minimize-url时Git默认会搜索上级目录

不使用–no-minimize-url时Git默认会搜索上级目录

请注意,该–authors-file文件中必须包括SVN工程所涉及所有提交者的信息,如果缺少会报错(请注意,git svn执行时会将所有历史branch找到,即使该branch已经被删除,这些被删除分支中可能还有别的提交者,因此可能会报错,需要在遇到错误时再添加):

userinfo.txt中必须包含所有提交者的映射信息

userinfo.txt中必须包含所有提交者的映射信息

当保留所有分支和提交记录时,git svn clone可能需要执行很久(This may take a while on large repositories),执行成功后形如:

git svn clone执行完成

git svn clone执行完成

此时可以看到master分支中的提交记录被完整保留了:

SVN中的原提交记录

SVN中的原提交记录

三、处理标签及分支

接下来我们需要处理SVN的标签及分支。直接执行git branch -a命令,我们会发现本地只有master一个分支,SVN的分支和标签都被当做了远程分支:

本地只有一个master分支

本地只有一个master分支

执行git show-ref可以看到所有的引用:

git show-ref

git show-ref

首先,处理标签,创建本地标签并删除对应的远程分支:

处理标签

处理标签

然后,在本地针对每一个远程分支创建对应的本地跟踪分支:

处理分支

处理分支

根据官方文档的描述,git svn会创建一个名为trunk的额外分支,它对应于Subversion的默认分支,然而trunk引用和master指向同一个位置。鉴于在Git中master最为常用,因此我们可以移除额外的分支:

删除无用的trunk分支

删除无用的trunk分支

此时,可以观察到分支结构正常了:

正确的分支

正确的分支

四、移除在SVN中已经被删除的分支

在git svn命令执行的过程中,已经在SVN中被删除的分支也会被fetch到。例如,如下的提交对应的SVN分支实际早就被删掉了,可以看到提交记录是空的:

在SVN中已被删除的分支也被GIT还原了

在SVN中已被删除的分支也被GIT还原了

我们可以利用如下的命令分别列出Git分支和SVN中的实际分支:

分别列出GIT和SVN的分支

分别列出GIT和SVN的分支

然后使用diff命令找出不在SVN中的分支,然后将其删除:

删除已从SVN中删除发分支

删除已从SVN中删除发分支

这时再次观察分支接口,已经与SVN一致:

正确的分支

正确的分支

六、添加Git远程仓库地址

配置Git的username和email,并配置仓库的远程地址(需要在Bitbucket中先创建对应的Repository):

七、Push

将所有分支与标签推送到远程仓库:

这样,我们就可以在Bitbucket中看到原SVN仓库相关的所有分支:

Bitbucket中可以看到原SVN仓库的所有分支

Bitbucket中可以看到原SVN仓库的所有分支

标签:

Bitbucket中可以看到原SVN仓库的所有标签

Bitbucket中可以看到原SVN仓库的所有标签

及提交记录:

Bitbucket中可以看到原SVN仓库的所有提交记录

Bitbucket中可以看到原SVN仓库的所有提交记录

参考文档:
1、https://git-scm.com/book/zh/v2/Git-%E4%B8%8E%E5%85%B6%E4%BB%96%E7%B3%BB%E7%BB%9F-%E8%BF%81%E7%A7%BB%E5%88%B0-Git,官方迁移文档;
2、https://blog.csdn.net/ouyang_peng/article/details/80372805
3、https://stackoverflow.com/questions/5914681/git-svn-bulk-removing-orphaned-remote-branches/7209462#7209462

转载时请保留出处,违法转载追究到底:进城务工人员小梅 » SVN2GIT之路(二)SVN到Git的手工迁移(保留所有分支、Tag及提交记录)

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址