位置: IT常识 - 正文

使用Git管理二进制大对象的方法(git可以管理二进制文件吗)

编辑:rootadmin
Git 是一个非常强大和扩展性非常强的系统应用软件,如何使用 Git 管理二进制大对象?下面小编将为大家详细的讲述使用Git管理二进制大对象的方法;希望对大家会有帮助,有需要的朋友一... 17-02-15

推荐整理分享使用Git管理二进制大对象的方法(git可以管理二进制文件吗),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:git管理二进制文件,git进入仓库,git二次开发管理,git2go,git2go,git2go,git进程,git二次开发管理,内容如对您有帮助,希望把文章链接给更多的朋友!

通过这系列的前六篇文章,我们已经学会使用 Git 来对文本文件进行版本控制的管理。我们不禁要问,还有二进制文件呢,也可进行进行版本控制吗?答案是肯定的,Git 已经有了可以处理像多媒体文件这样的二进制大对象块(blob)的扩展。因此,今天我们会学习使用 Git 来管理所谓的二进制资产。

似乎大家都认可的事就是 Git 对于大的二进制对象文件支持得不好。要记住,二进制大对象与大文本文件是不同的。虽然 Git 对大型的文本文件版本控制毫无问题,但是对于不透明的二进制文件起不了多大作用,只能把它当作一个大的实体黑盒来提交。

设想这样的场景,有一个另人兴奋的第一人称解密游戏,您正在为它制作复杂的 3D 建模,源文件是以二进制格式保存的,最后生成一个 1GB 大小的的文件。您提交过一次,在 Git 源仓库历史中有一个 1GB 大小的新增提交。随后,您修改了下模型人物的头发造型,然后提交更新,因为 Git 并不能把头发从头部及模型中其余的部分离开来,所以您只能又提交 1GB 的量。接着,您改变了模型的眼睛颜色,提交这部分更新:又是 GB 级的提交量。对一个模型的一些微小修改,就会导致三个 GB 级的提交量。对于想对一个游戏所有资源进行版本控制这样的规模,这是个严重的问题。

不同的是如obj这种格式的文本文件,和其它类型文件一样,都是一个提交就存储所有更新修改状态,不同的是obj 文件是一系列描述模型的纯文本行。如果您修改了该模型并保存回obj 文件,Git 可以逐行读取这两个文件,然后创建一个差异版本,得到一个相当小的提交。模型越精细,提交就越小,这就是标准的 Git 用例。虽然文件本身很大,但 Git 使用覆盖或稀疏存储的方法来构建当前数据使用状态的完整描述。

然而,不是所有的都是纯文本的,但都要使用 Git,所以需要解决方案,并且已经出现几个了。

OSTree 开始是作为 GNOME 项目出现的,旨在管理操作系统的二进制文件。它不适用于这里,所以我直接跳过。

Git 大文件存储(LFS) 是放在 GitHub 上的一个开源项目,是从 git-media 项目中分支出来的。git-media 和 git-annex 是 Git 用于管理大文件的扩展。它们是对同一问题的两种不同的解决方案,各有优点。虽然它们都不是官方的项目,但在我看来,每个都有独到之处:

git-media 是集中模式,有一个公共资产的存储库。你可以告诉 git-media 大文件需要存储的位置,是在硬盘、服务器还是在云存储服务器,项目中的每个用户都将该位置视为大型文件的中心主存储位置。 git-annex 侧重于分布模式。用户各自创建存储库,每个存储库都有一个存储大文件的本地目录git/annex。这些 annex 会定期同步,只要有需要,每个用户都可以访问到所有的资源。除非通过 annex-cost 特别配置,否则 git-annex 优先使用本地存储,再使用外部存储。

对于这些,我已经在生产中使用了 git-media 和 git-annex,那么下面会向你们概述其工作原理。

git-media

git-media 是使用 Ruby 语言开发的,所以首先要安装 gem(LCTT 译注:Gem 是基于 Ruby 的一些开发工具包)。安装说明在其网站上。想使用 git-meida 的用户都需要安装它,因为 gem 是跨平台的工具,所以在各平台都适用。

安装完 git-media 后,你需要设置一些 Git 的配置选项。在每台机器上只需要配置一次。

$git config filter.media.clean "git-media filter-clean"$ git config filter.media.smudge "git-media filter-smudge"

在要使用 git-media 的每个存储库中,设置一个属性以将刚刚创建的过滤器结合到要您分类为“媒体”的文件类型里。别被这种术语混淆。一个更好的术语是“资产”,因为“媒体”通常的意思是音频、视频和照片,但您也可以很容易地将 3D 模型,烘焙和纹理等归类为媒体。

例如:

$ echo "*.mp4 filter=media -crlf" >> .gitattributes$ echo "*.mkv filter=media -crlf" >> .gitattributes$ echo "*.wav filter=media -crlf" >> .gitattributes$ echo "*.flac filter=media -crlf" >> .gitattributes$ echo "*.kra filter=media -crlf" >> .gitattributes使用Git管理二进制大对象的方法(git可以管理二进制文件吗)

当您要暂存stage这些类型的文件时,文件会被复制到git/media目录。

假设在服务器已经有了一个 Git 源仓库,最后一步就告诉源仓库“母舰”所在的位置,也就是,当媒体文件被推送给所有用户共享时,媒体文件将会存储的位置。这在仓库的 git/config 文件中设置,请替换成您的用户名、主机和路径:

[git-media]transport = scpautodownload = false #默认为 true,拉取资源scpuser = sethscphost = example.comscppath = /opt/jupiter.git

如果您的服务器上 SSH 设置比较复杂,例如使用了非标准端口或非默认 SSH 密钥文件的路径,请使用ssh/config为主机设置默认配置。

git-media 的使用和普通文件一样,可以把普通文件和 blob 文件一样对待,一样进行 commit 操作。操作流程中唯一的不同就是,在某些时候,您应该将您的资产(或称媒体)同步到共享存储库中。

当要为团队发布资产或自己备份资料时,请使用如下命令:

$ git media sync

要用一个变更后的版本替换 git-media 中的文件时(例如,一个已经美声过的音频文件,或者一个已经完成的遮罩绘画,或者一个已经被颜色分级的视频文件),您必须明确的告诉 Git 更新该媒体。这将覆盖 git-media 不会复制远程已经存在的文件的默认设置:

$ git update-index --really-refresh

当您团队的其他成员(或是您本人,在其它机器上)克隆本仓库时,如果没有在git/config中把autodownload选项设置为true的话,默认是不会下载资源的。但 git-media 的一个同步命令git media sync可解决所有问题。

git-annex

git-annex 的处理流程略微的有些不同,默认是使用本地仓库的,但基本的思想都一样。您可以从你的发行版的软件仓库中安装 git-annex,或者根据需要从该网站上下载安装。与 git-media 一样,任何使用 git-annex 的用户都必须在其机器上安装它。

其初始化设置比 git-media 都简单。运行如下命令,其中替换成您的路径,就可以在您的服务器上创建好裸存储库:

$ git init --bare --shared /opt/jupiter.git

然后克隆到本地计算机,把它标记为 git-annex 的初始路径:

$ git clone seth@example.com:/opt/jupiter.cloneCloning into 'jupiter.clone'... warning: You appear to have clonedan empty repository. Checking connectivity... done.$ git annex init "seth workstation" init seth workstation ok

不要使用过滤器来区分媒体资源或大文件,您可以使用git annex 命令来配置归类大文件:

$ git annex add bigblobfile.flacadd bigblobfile.flac(checksum) ok(Recording state in Git...)

跟普通文件一样进行提交操作:

$ git commit -m 'added flac source for sound fx'

但是推送操作是不同的,因为git annex使用自己的分支来跟踪资产。您首次推送可能需要-u 选项,具体取决于您如何管理您的存储库:

$ git push -u origin master git-annexTo seth@example.com:/opt/jupiter.git* [new branch] master -> master* [new branch] git-annex -> git-annex

和 git-media 一样,普通的git push 命令是不会拷贝资料到服务器的,仅仅只是发送了相关的消息,要真正共享文件,需要运行同步命令:

$ git annex sync --content

人已经提交了共享资源,您需要拉取它们,git annex sync 命令将提示您要在本地检出你本机没有,但在服务器上存在的资源。

git-media 和 git-annex 都非常灵活,都可以使用本地存储库来代替服务器,所以它们也常用于管理私有的本地项目。

Git 是一个非常强大和扩展性非常强的系统应用软件,我们应该毫不犹豫的使用它。现在就开始试试吧!

本文链接地址:https://www.jiuchutong.com/zhishi/281404.html 转载请保留说明!

上一篇:家用电脑的基本维护常识(家用电脑分为哪几类)

下一篇:ibguard.exe进程文件诊断 是什么进程 ibguard进程查询(application guard)

  • 开票人和复核人收款人能是一个人吗
  • 补缴以前年度附加税
  • 开具技术服务费发票需要注意什么
  • 购进餐饮服务的会计分录
  • 残保金申报在哪申报
  • 商会会费是什么意思
  • 房地产公司支付工程款账务处理
  • 长期股权投资的初始投资成本
  • 收到实收资本要交什么税
  • 汽车固定资产清理账务处理
  • 营改增后进项税额分摊
  • 开了专票不报销犯法吗
  • 固定资产的知识
  • 固定资产本期折旧额与上期不一样
  • 视同销售的消费税计入成本吗?
  • 现金折扣 会计处理
  • 3%增值税率包括哪些
  • 个体工商户税收优惠政策2023年最新
  • 对方发票丢失开什么证明
  • 福利企业的增值税是多少
  • 成本差异的种类有哪些?
  • 公司账上的钱如何取出来
  • 装修公司什么要自己买
  • 店铺员工证费用计入什么科目?
  • QuickBooks - QuickBooks是什么进程 有什么用
  • 评估增值的账务处理
  • 以前年度损益调整借贷方向
  • 现金流量具体内容
  • 环境保护税入账什么会计科目
  • cpuz.exe
  • 智能路由器哪个牌子好
  • 琼斯的大海怪
  • PHP:mb_strrpos()的用法_mbstring函数
  • php字符串操作函数
  • 保险支付方式有哪些
  • 股权投资借差
  • 白鹤芋好养活吗
  • 基于transformer的文本分类
  • 增值税即征即退操作流程
  • 迭代器,生成器
  • css 100vw、100vh出现滚动条怎么解决
  • vi命令模式下的常用命令有哪些?
  • 销售费用占销售额比例怎么算
  • 税务三方协议怎么重签
  • 费用退回如何记账
  • dedecms怎么更换模板
  • discuz设置门户
  • 差旅费需要缴纳增值税吗
  • 发票备注栏必须写吗
  • 商场超市收银员每日工作流程
  • 待处理财产损益是什么类科目
  • 企业计提坏账准备时应该借记什么科目
  • 什么是原始凭证?简述原始凭证审核的内容
  • 事业单位收到退税账务处理
  • 长期借款利息是财务费用吗
  • 资金结余率怎么算
  • 收履约保证金的会计分录
  • 暂估入库结转成本
  • 执行企业会计准则和小企业会计准则的区别
  • 税务登记证办理流程
  • 旧账整理方案
  • windowxp操作系统
  • Linux系统中Squid代理服务器配置全过程解析
  • 明日之后白树高地怎么钓凤尾鱼
  • lumia 925 win10
  • win8找不到桌面
  • node.js使用教程
  • python2.7安装numpy
  • 如何优化营商环境
  • Open quote is expected for attribute "name" associated with an element type "item".
  • unity3d如何导入图片
  • android需要学什么
  • jquery on()
  • 堆实现栈
  • 江苏国税电子税务局怎么申报
  • 江西省电子信息职业学院
  • 电信业务发票
  • 江西国税局电话客服热线
  • 绵阳税务局副局长
  • 印花税会计分录怎么做 印花税需要计提吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设