git仓库批量备份

git的mirror参数

在git中,--mirror是一个用于克隆和推送操作的参数。它用于创建一个镜像仓库,包含了源仓库的所有分支、标签和提交历史记录。

当使用git clone --mirror <source-repo>命令时,会创建一个完全相同的镜像仓库,其中包含源仓库的所有内容。与普通克隆不同,镜像仓库会将所有的分支和标签都设为跟踪远程仓库的分支和标签。这意味着可以使用镜像仓库进行完整的版本控制操作,包括查看历史记录、切换分支等。

对于已经clone下载的仓库,如果远程仓库更新了,则可以用git fetch --prune对本地仓库保持同步。当执行该命令时,git会从远程仓库获取最新的提交和分支信息,并将这些更新同步到本地仓库的远程跟踪分支中。同时,它还会检查本地的远程跟踪分支,如果在远程仓库中已经删除了某个分支,那么它也会将这个本地的远程跟踪分支删除。

当在镜像仓库上执行git push --mirror <destination-repo>命令时,将会把镜像仓库的所有内容推送到目标仓库中,包括分支、标签和提交历史记录。

利用这些特性我们就可以完整备份git仓库。

命令行操作

$ git clone --mirror git@git.example.com/example.git
Cloning into bare repository 'example.git'...
remote: Enumerating objects: 760, done.
remote: Counting objects: 100% (760/760), done.
remote: Compressing objects: 100% (438/438), done.
remote: Total 760 (delta 280), reused 759 (delta 279)
Receiving objects: 100% (760/760), 4.79 MiB | 9.97 MiB/s, done.
Resolving deltas: 100% (280/280), done.
$ cd example.git/
$ tree -L 1
.
├── branches
├── config
├── description
├── HEAD
├── hooks
├── info
├── objects
├── packed-refs
└── refs5 directories, 4 files

需要使用ssh或者git地址,不要使用http地址,并把ssh public key传输到git服务器上,避免clone的时候需要输入密码。对于单个仓库,手动执行足够了,但对于批量仓库操作需要封装成api待用。

python示例代码

import os
import sys
import timeclass GitMirror():def __init__(self):pass@staticmethoddef os_system(cmd):print("execute command [%s]" % cmd)os.system(cmd)@staticmethoddef mirror_fetch(local_path, remote_path):local_git_path = local_path + ".git"parent_path = os.path.dirname(local_git_path)# not first runif os.path.exists(local_git_path):print("enter [%s] and fetch" % (local_git_path))GitMirror.os_system("git --git-dir=%s fetch --prune" % local_git_path)else:  # first run, git cloneprint("git clone mirror from [%s] " % (remote_path))GitMirror.os_system("mkdir -p %s; cd %s; git clone --mirror %s" % (parent_path, parent_path, remote_path))time.sleep(0.2)if __name__ == "__main__":GitMirror.mirror_fetch("/home/dev/backup/example", "git@git.example.com/example.git")

批量获取仓库地址

gitlab, github, gitee,gerrit等git托管服务都提供了REST api,可以通过这些api批量获取仓库信息。以gitlab为例(https://docs.gitlab.com/ee/api/rest/ )

一 获取Access Tokens

首先需要获取Acess Tokens, 在gitlab用户管理界面中找到 “Access Tokens” 标签,输入token名字,勾选 "api"生成token。注意,生成token后务必保存下来,因为后面就再也看不到了,如果没存下来,只能重新生成。
在这里插入图片描述

二 通过api获取全部projects

通过curl --header "PRIVATE-TOKEN: <your_access_token>" "https://gitlab.example.com/api/v4/projects"可以获取本人以及本人可见的项目(Projects API | GitLab)。

把curl命令转换成python。

在获取全部项目的时候,每次只能返回1页的项目,所以想要获取全部项目,需要分页获取。

返回的项目信息中,有一个非常重要的字段"ssh_url_to_repo",有了项目地址就可以进行完整备份了。

import requestsclass GitlabApi():def __init__(self, token, url):self.token = tokenself.url = "%s%s" %(url, "api/v4/")self.header = {"Content-Type": "application/json","Private-Token": self.token}def get_all_projects(self):data = []page = 0total_pages = 1while page < total_pages:api_url = "%s%s%s" % (self.url, "projects", "?page=%d" % page)res = requests.get(api_url, headers = self.header)total_pages = int(res.headers["X-Total-Pages"])data += res.json()page += 1return dataif __name__ == "__main__":api = GitlabApi("your_token", "http://git.example.com/")res = api.get_all_projects()for i in res:print(i)

三 根据项目信息备份全部仓库

根据服务器的路径,在本地也做一个对应的目录结构。

def signal_handler(signum, frame):sys.exit(0)if __name__ == "__main__":signal.signal(signal.SIGINT, signal_handler)signal.signal(signal.SIGTERM, signal_handler)api = GitlabApi("your_token", "http://git.example.com/")download_path = os.path.join(os.path.abspath(os.getcwd()), "tmp")res = api.get_all_projects()for i in res:path = os.path.join(download_path, i["path_with_namespace"])GitMirror.mirror_fetch(path, i["ssh_url_to_repo"])with open("%s%s.json"%(path, i["name"]), "w") as fout:fout.write(json.dumps(i, indent=4))print("total %d" % len(res))

完整代码

import json
import os.path
import sys
import signal
import time
import requestsclass GitlabApi():def __init__(self, token, url):self.token = tokenself.url = "%s%s" %(url, "api/v4/")self.header = {"Content-Type": "application/json","Private-Token": self.token}def get_all_projects(self):data = []page = 0total_pages = 1while page < total_pages:api_url = "%s%s%s" % (self.url, "projects", "?page=%d" % page)res = requests.get(api_url, headers = self.header)total_pages = int(res.headers["X-Total-Pages"])data += res.json()page += 1return dataclass GitMirror():def __init__(self):pass@staticmethoddef os_system(cmd):print("execute command [%s]" % cmd)os.system(cmd)@staticmethoddef mirror_fetch(local_path, remote_path):local_git_path = local_path + ".git"parent_path = os.path.dirname(local_git_path)# not first runif os.path.exists(local_git_path):print("enter [%s] and fetch" % (local_git_path))GitMirror.os_system("git --git-dir=%s fetch --prune" % local_git_path)else:  # first run, git cloneprint("git clone mirror from [%s] " % (remote_path))GitMirror.os_system("mkdir -p %s; cd %s; git clone --mirror %s" % (parent_path, parent_path, remote_path))time.sleep(0.2)def signal_handler(signum, frame):sys.exit(0)if __name__ == "__main__":signal.signal(signal.SIGINT, signal_handler)signal.signal(signal.SIGTERM, signal_handler)api = GitlabApi("your_token", "http://git.example.com/")download_path = os.path.join(os.path.abspath(os.getcwd()), "tmp")res = api.get_all_projects()for i in res:path = os.path.join(download_path, i["path_with_namespace"])GitMirror.mirror_fetch(path, i["ssh_url_to_repo"])with open("%s%s.json"%(path, i["name"]), "w") as fout:fout.write(json.dumps(i, indent=4))print("total %d" % len(res))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/440228.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

promethues之POD搭建

服务自动发现 consonl node主机发现 kube-api自动发现 prometheus的容器化部署 mdkir prometheus cd prometheus mdkir node cd node vim node.yaml apiVersion: apps/v1 kind: DaemonSet metadata:name: node-exporternamespace: monitor-salabels:name: node-exporter sp…

Shell中sed编辑器

1.简介 sed是一种流编辑器&#xff0c;流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。 sed编辑器可以根据命令来处理数据流中的数据&#xff0c;这些命令要么从命令行中输入&#xff0c;要么存储在一个 命令文本文件中。 2.sed编辑器的工作流程 sed…

实战教程:如何用Spring Boot和MySQL存储共享单车数据

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…

STM32学习笔记一——初识STM32

目录 一、什么是ARM 二. Cortex 内核 三.什么是STM32 四.STM32核心板原理图&#xff1a; 五.STM32的内部结构&#xff1a; 六.stm32系统结构简化图 STM32基本原理分析&#xff1a; 七.典型型号——STM32F103ZET6 stm32——32位单片机&#xff08;数据总线是32位的&am…

docker可视化操作

docker可视化操作&#xff0c;ui界面操作 1.检查docker服务状态 docker status2.安装服务 部署 Portainer 1.从镜像仓库中拉取 Portainer&#xff1a;docker pull portainer/portainer2.创建数据卷&#xff1a; docker volume create portainer_db 3.启动 Portainer命令&…

Unity:构建游戏和交互应用的强大引擎

Unity&#xff1a;构建游戏和交互应用的强大引擎 在游戏开发和交互应用领域&#xff0c;Unity 已经成为最受欢迎和广泛使用的开发引擎之一。无论是独立开发者、游戏工作室还是企业开发团队&#xff0c;Unity 都提供了强大的工具和功能&#xff0c;帮助开发者构建出令人惊叹的视…

Docker 搭建MySQL主从复制-读写分离

一. 介绍 MySQL主从复制是一种常用的数据库高可用性解决方案&#xff0c;通过在主数据库上记录的数据变更&#xff0c;同步到一个或多个从数据库&#xff0c;实现数据的冗余备份和读写分离。在Docker环境下搭建MySQL主从复制和读写分离&#xff0c;不仅方便管理&#xff0c;还…

java-JUC并发编程学习笔记03(尚硅谷)

线程间通信 例子&#xff1a; 对一个值1 -1交替完成&#xff0c;a的值就是1 b的值就是0 这个过程就是线程间通信 Synchronized实现&#xff1a; 虚假唤醒问题&#xff1a; 我们再添加两个线程。 我们发现我们的结果就不对了。 我们只需要使用while即可。 我们线程通信的最后一…

Spring 学习1

1、什么是Spring Spring 是一款主流的 Java EE 轻量级开源框架 &#xff0c;Spring 由“Spring 之父”Rod Johnson 提出并创立&#xff0c;其目的是用于简化 Java 企业级应用的开发难度和开发周期。Spring的用途不仅限于服务器端的开发。从简单性、可测试性和松耦合的角度而言…

vue3-hand-mobile

当我写完手势移动事件后&#xff0c;我又通过svg的方法添加了一段文字和polygon。当我在这个蓝色的polygon上滑动手势的时候&#xff0c;会报错。 可能这个bug只是我个人的代码导致的。但是我觉得vue3-hand-mobile插件的这一段代码写的有问题。 我通过circular-json库修复了这…

保护医疗数据不受威胁:MPLS专线在医疗网络安全中的角色

随着数字技术的快速发展&#xff0c;医疗行业正在经历一场革命。从电子健康记录到远程医疗服务&#xff0c;数字化不仅提高了效率&#xff0c;也带来了前所未有的挑战--尤其是关于数据安全和隐私保护的挑战。在这样的背景下&#xff0c;如何确保敏感的医疗数据安全传输&#xf…

136832-63-8,活细胞示踪剂CMFDA(绿色),5-氯甲基荧光素二醋酸酯,广泛应用于细胞追踪和标记实验中

136832-63-8&#xff0c;活细胞示踪剂CMFDA(绿色)&#xff0c;5-氯甲基荧光素二醋酸酯&#xff0c;CellTracker Green CMFDA&#xff0c;可以用于基因表达分析等实验中&#xff0c;广泛应用于细胞追踪和标记实验中 您好&#xff0c;欢迎来到新研之家 文章关键词&#xff1a;1…