百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

十年码农讲解Linux型内核,操作系统——虚拟文件系统

cac55 2024-10-11 10:51 25 浏览 0 评论

1、虚拟文件系统的分层结构

上层:虚拟文件系统

底层:特定文件系统模块,例如:网络文件系统(nfs、smb)等其他类型文件系统

虚拟文件系统的目的:将接口暴露给用户,屏蔽底层文件系统的差异性,它是对所有不同文件系统的抽象

虚拟文件系统的功能: 
- 提供一致的文件和文件系统接口 
- 管理所有文件和文件系统关联的数据结构 
- 高效查询例程,遍历文件系统 
- 与特定文件系统模块的交互


基本数据结构: 
- 卷控制块,总的,superblock,每个文件系统一个,块,块大小,空余块,计数/指针等 
- 文件控制块:VNODE/INODE, 单个文件一个,文件的详细信息 
- 目录节点:dentry(dictionary entry),每个目录项一个,将目录项数据结构及属性布局编码成树型数据结构

数据持续存储在二级存储中,当需要时加载进内存。

二级存储(secondary storage,auxiliary storage)是计算机主存储器或内存之外的所有可访问数据存储器。即为硬盘、磁带、光盘等非易失性存储。

卷控制块:文件系统挂载时进入内存

文件控制块:文件被访问时进入内存

目录节点: 在遍历一个文件路径时进入内存

2、数据块缓存

如今缓存的概念已被扩充,不仅在CPU和主内存之间有Cache(L1 cache、L2 cache),而且在内存和硬盘之间也有Cache(磁盘缓存),乃至在硬盘与网络之间也有某种意义上的Cache──称为Internet临时文件夹或网络内容缓存等。凡是位于速度相差较大的两种硬件之间,用于协调两者数据传输速度差异的结构,均可称之为Cache。

我们这里说的数据块缓存是磁盘缓存!

数据块就是block块,它是主存和外存传输数据的单位,文件存取的最小单位。

#缓存过程:
数据块按需读入内存,数据块使用后被缓存
#两种数据块缓存方式,缓存的粒度不同
普通缓冲区缓存
页缓存:统一缓存数据块和内存页

文件数据块的页面缓存

在虚拟内存中文件数据块被映射成页
文件的读/写操作被转换成对内存的访问
可能导致缺页、脏页
相应算法,尽量减少对硬盘的读写次数,类似之前的算法

3、打开文件的数据结构

我们先看一段python代码:

fd = open('db.txt',mode='rt',encoding='utf-8') 
res = fd.read()
print(res)
fd.close()

上述代码是一段用于文件操作的代码。

打开文件的过程:fd是文件描述符(又叫文件句柄、文件对象),open一个文件,就会产生一个文件描述符,然后将该文件描述符存入打开该文件的进程的打开文件表。

#文件描述符
	每个被打开的文件一个
	文件状态信息
	目录,当前文件指针。。。。
#打开文件表 
	一个进程一个(进程打开文件表又叫文件描述符表)
	一个系统级的(系统打开文件表)
	每个超级区块也会保存一个列表,进程打开文件的基本信息 #这个不是很明白!我猜测前面的系统打开文件表应该是虚拟文件系统的打开文件表,不论nfs、smb、ext2所有的打开文件的情况里面都有。每个superblock的文件打开表,例如nfs,应该就只是nfs文件系统的打开文件表。

文件描述符表、系统打开文件表、inode之间的关系如图所示:

文件偏移量:即为文件指针的偏移量,每一个文件被打开之后,内核都维护一个所谓的当前文件位置偏移量,读和写操作都会对这个偏移量产生影响。

inode和文件描述符之间的关系:

在linux中,内核通过inode来找到每个文件,但一个文件可以被许多用户同时打开或一个用户同时打开多次。这就有一个问题,如何管理文件的当前位移量,因为可能每个用户打开文件后进行的操作都不一样,这样文件位移量也不同,当然还有其他的一些问题。所以linux又搞了一个文件描述符(file descriptor)这个东西,来分别为每一个用户服务。每个用户每次打开一个文件,就产生一个文件描述符,多次打开就产生多个文件描述符,一一对应,不管是同一个用户,还是多个用户。该文件描述符就记录了当前打开的文件的偏移量等数据。

#所以一个i节点可以有0个或多个文件描述符与之对应。可以看成文件描述符是对i节点的索引。

4、文件分配

为应对不同大小的文件,如何为一个文件分配数据块呢?

#分配方式
	连续分配
	链式分配
	索引分配
#评价指标:
	时间高效
	空间高效

(1)连续分配

I:文件头

上图中数据块的分配都是连续的。因为是连续的,如果再往文件写内容,那么我们看A文件内容还能加多少?所以它一般用于写文件。

优点:文件读取表现好,高效的顺序和随机访问

劣势:碎片,文件增长问题(预分配,按需分配),类似数组 (长度不可变)

注意这种模式:最好用于只读文件

(2)链式分配

以数据块链表的方式存储,文件头包含了第一块和最后一块的指针

访问链表中间的一个数,是需要对链表进行遍历的,所以不可随机访问。

优点:创建,增大缩小容易,没有碎片

缺点:不可随机访问,可靠性(破坏一个链接然后整个文件都崩了)

(3)索引分配

IB:索引数据块

每个磁盘块(索引项),为每个文件创建一个名为索引数据块的非数据数据块(到文件数据块的指针列表)

文件头包含了索引数据块

优点:创建,增大缩小都很容易,没有碎片,支持直接访问

缺点:当文件很小时,存储索引的开销,如何处理大文件?

释意:文件大,占用数据块就多,那么相对的索引数据就变大了,我们一个索引数据块就不够用了,所以我们需要多个索引数据块

大文件采用分层的方式,类似内存管理的思想: 
- 链式索引块 
- 多级索引块,文件头包含多个指针 #类似多级页表

5、空间列表

空间列表的作用:跟踪在存储中的所有未分配的数据块,为了更好的分配空闲块。

用位图代表空闲数据块列表

11111001111,如果i = 0 代表数据块为空闲

假设空闲空间在磁盘中均匀分布,那么找到空闲数据块前需要扫描n/r

n —-磁盘上数据块的总数

r —- 空闲块的总数

为了保护空间列表和实际空闲块的位置的一致性:

位图必须保存在磁盘上
不允许block在内存中的状态为1而在磁盘中为0 ,这种不一致情况发生,因此需要在硬盘中完成把位图中的相应空闲块置为1之后再真正为文件分配数据块,文件内容写入数据块

空间列表的实现方式:

Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈-学习视频教程-腾讯课堂

相关推荐

无力吐槽的自动续费(你被自动续费困扰过吗?)

今天因为工作需要,需要在百度文库上下载一篇文章。没办法,确实需要也有必要,只能老老实实的按要求买了个VIP。过去在百度文库上有过类似经历,当时为了写论文买了一个月的VIP,后面也没有太注意,直到第二个...

百度文库推出“文源计划”创作者可一键认领文档

11月7日,百度文库发布了旨在保护创作者权益的“文源计划”。所谓“文源计划”,即为每一篇文档找到源头,让创作者享受更多的权益。据百度文库总经理李小婉介绍,文源计划分为三部分,分别是版权认证、版权扶持和...

有开放大学学号的同学,百度文库高校版可以用了。

还在网上找百度文库的下载方式,只要从身边的朋友在读开放大学的,那他(她)的学号就可以登陆到国家开放大学图书馆,还使用百度文库高校版来下载。与百度文库稍有不同,但足够使用了。现转国图链接如下:htt...

搜索资源方法推荐(搜索资源的方法)

今天msgbox就要教大家如何又快又准的搜到各类资源,第一点,排除干扰百度搜索出来啊经常前排展示它的产品以及百度文库,如何去除呢?很简单,后面输入空格减号百度文库,比如你搜高等数学百度文库很多,只要后...

一行代码搞定百度文库VIP功能(2021百度文库vip账号密码共享)

百度文库作为大家常用查资料找文档的平台,大多数文档我们都可以直接在百度文库找到,然而百度文库也有让人头痛的时候。好不容易找到一篇合适的文档,当你准备复制的时候他却提示你需要开通VIP才能复制~~~下载...

百度文库文档批量上传工具用户说明书

百度文库文档批量上传工具用户说明书1、软件主要功能1、批量上传文档到百度文库,支持上传到收费、VIP专享、优享以及共享。2、支持自动分类和自动获取标签3、支持多用户切换,一个账户传满可以切换到...

百度文库现在都看不到文档是否上传成功,要凉了吗?

打开知识店铺,百度文库文档里显示都是下载这一按键,上传的文档也看不到是否成功?咋情况,要取消了吗?没通过审核的也不让你删除,是几个意思,想通吃吗?现在百度上传文档也很费劲,有时弄了半天的资料上传审核过...

微信推广引流108式:利用百度文库长期分享软文引流

百度文库相对于百度知道、百度百科来说,操作上没那么多条条框框,规则上也相对好把握些。做一条百度知道所花费的精力一般都会比做一条百度文库的要多些,老马个人操作下来觉得百度文库更好把握。但见仁见智吧,今天...

职场“避雷”指南 百度文库推出标准化劳动合同范本

轰轰烈烈的毕业季结束了,众多应届生在经过了“职场海选”后,已正式成为职场生力军的一员。这一阶段,除了熟悉业务,签订劳动合同、了解职场福利也迅速被提上日程。而随着国人法律意识的增强,百度文库内《劳动合同...

《百度文库》:素材精选宝库(百度文库官网首页)

《百度文库》:独特功能助力选择高质量素材在当今信息爆炸的时代,如何高效地获取并利用有价值的素材成为了许多人面临的挑战。而《百度文库》作为百度公司推出的一款在线文档分享平台,凭借其丰富的资源、强大的功能...

深度整合和开放AI能力 百度文库和网盘推出内容操作系统「沧舟OS」

【TechWeb】4月25日消息,Create2025百度AI开发者大会上,百度文库和百度网盘推出全球首个内容操作系统——沧舟OS。基于沧舟OS,百度文库APP全新上线「GenFlow超能搭子」...

女子发现大二作业被百度文库要求付费下载,律师:平台侵权,应赔偿

近日,28岁的黎女士在百度百科搜索家乡的小地名时,发现了自己在大二完成的课题作业。她继续搜索,发现多个平台收录了该文,比如豆丁网和文档之家等,有的还设置了付费或积分下载。2月15日,九派新闻记者以用户...

2016杀入百度文库的新捷径,只有少数人才知道的喔

百度的产品在SEO优化中的分量真不用多说,其实很多人都像我一样一直在找捷径。但是我经常发现很多人都是在用死方法。比如发贴吧发帖而不知道去申请一个吧主,知道自问自答而不知道去申请一个合作资格。口碑和贴吧...

百度文库付费文档搜索方法(百度文库付费文档搜索方法有哪些)

一直以来,百度文库中无论是个人中心还是个人主页,都没有像淘宝一样的店内搜索功能,连最近新开的知识店铺也没有设计店内搜索功能,这无论是对上传用户还是下载用户都不方便,上传用户想要搜索自己的文档无法办到...

供读者免费使用!泰达图书馆机构版百度文库新年上新啦

在泰达图书馆读者使用百度文库数字资源不需要VIP,免-费-用!惊不惊喜?快来了解一下吧……新年伊始,为满足区域企业、高校、科研院所以及居民群众在教学、科研及学习过程中,对各类文献资源的需求,泰达图书馆...

取消回复欢迎 发表评论: