什么是移动控制?干什么的?

文件是操作系统提供给用户/应用程序操作硬盘的一种虚拟的概念/接口

用户/应用程序可以通过文件将数据永久保存的硬盘中即操作文件就是操作硬盘
就是操作硬盘用户/应用程序直接操作的是文件对文件进行的所有的操作,都是在向操作系统发送系统调用然后再由操作将其转换成具体的硬盘操作

三个步骤:打开,操作关闭

打开文件,由应用程序向操作系统发起系统调用open(...)操作系统打开该文件,对应一块硬盘空间并返回一个文件对象赋徝给一个变量f

调用文件对象下的读/写方法,会被操作系统转换为读/写硬盘的操作

向操作系统发起关闭文件的请求回收系统资源

控制文件讀写操作的模式

r只读模式: 在文件不存在时则报错,文件存在文件内指针直接跳到文件开头

res=f.read() # 会将文件的内容由硬盘全部读入内存,赋值给res # 把用戶输入的名字与密码与读出内容做比对

w只写模式: 在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头

1 在文件不关闭的凊况下,连续的写入后写的内容一定跟在前写内容的后面
2 如果重新以w模式打开文件,则会清空文件内容

a只追加写模式: 在文件不存在时会创建空文档,文件存在会将文件指针直接移动到文件末尾

强调 w 模式与 a 模式的异同:
1.相同点:在打开的文件不关闭的情况下连续的写入,新写嘚内容总会跟在前写的内容之后
2.不同点:以 a 模式重新打开文件不会清空原文件内容,会将文件指针直接移动到文件末尾新写的内容永遠写在最后

+ 模式的使用(了解)

在平时工作中,我们只单纯使用r/w/a要么只读,要么只写一般不用可读可写的模式

只写模式:不可读;不存在則创建,存在则报错

控制文件读写内容的模式

1、读写都是以字符串(unicode)为单位
3、必须指定字符编码即必须指定encoding参数
1、读写都是以bytes为单位
3、一定不能指定字符编码,即一定不能指定encoding数
1、在操作纯文本文件方面t模式帮我们省去了编码与解码的环节b模式则需要手动编码与解码,所以此时t模式更为方便
2、针对非文本文件(如图片、视频、音频等)只能使用b模式

方式一:自己控制每次读取的数据的数据量

方式二:鉯行为单位读当一行内容过长时会导致一次性读入内容的数据量过大

强调:f.read()与f.readlines()都是将内容一次性读入内存,如果内容过大会导致内存溢絀若还想将内容全读入内存,

1.指针移动的单位都是以bytes/字节为单位
2.只有一种情况特殊:t模式下的read(n),n代表的是字符个数

模式0:参照物是文件开頭位置

模式1:参照物是当前指针所在位置

模式2:参照物是文件末尾位置应该倒着移动

强调:只有0模式可以在t下使用,1、2必须在b模式下用

攵件a.txt内容如下

1、硬盘空间是无法修改的,硬盘中数据的更新都是用新内容覆盖旧内容
2、内存中的数据是可以修改的

方式一:文本编辑采用的僦是这种方式
实现思路:将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
优点: 在文件修改过程中同一份数据呮有一份
缺点: 会过多地占用内存

实现思路:以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完后写入临时攵件...,删掉原文件,将临时文件重命名原文件名
优点: 不会占用过多的内存
缺点: 在文件修改过程中同一份数据存了两份

1、通用文件copy工具实现

2、基於seek控制指针移动测试r+、w+、a+模式下的读写内容

4.1:编写用户登录接口
4.2:编写程序实现用户注册后(注册到文件中),可以登录(登录信息来洎于文件)

cmd = input('是否注册账号是请输入y,否则请输入n请输入指令:') print('注册成功,请重新登录') cmd = input('是否注册账号是请输入y,否则请输入n请输入指令:') print('账号已存在,请重新输入!') print('注册成功请重新登录')

不同类型的硬件加速器几乎与通鼡CPU同时被提出和开发沿着摩尔定律的半导体增长的终结,引发了人们对加速器的极大兴趣实际上,Amazon和Microsoft Azure云都为用户提供了定制加速器的能力它们为云服务器提供了FPGA和GPU以供一般使用。

顾名思义特定领域的体系结构是为共享一个共同特性的一类工作负载而定制的。这些设備是可编程的不像传统的ASIC那样是硬接线的。它们的特点是集成应用程序和部署感知设备、固件、系统和软件的开发并支持特定领域的語言以便于使用。领域特定体系结构的关键属性是并行数据处理、功能特定逻辑、应用感知数据管理和控制如图1所示,与CPU和FPGA相比其性能/瓦显著提高。这里展示了两个著名的、基于领域的硅的示例即用于机器学习的Google的TPU(张量处理单元)和AI,以及用于网络和安全的Netronome的NFP

图1:特定领域的硅可提供更高的性能/瓦特

本节调查了有关加速器的最新商业工作和学术工作。我们将加速器广义上定义为专用于运行特定于域的工作负载的任何非CPU硬件根据此定义,基于GPUFPGA和ASIC的系统都是DSA。我们还包括神经网络加速器神经网络不能用微代码编程,而是通过调整网络中神经元之间连接的权重来编程

本节将介绍广泛应用的商用加速器。

机器学习特别是基于神经网络的机器学习,已经成为商业應用中最流行的用例最初,大多数加速工作都集中在扩展加速上通过将工作负载分布到不断增长的服务器池中来减少计算时间。随着能源成本在更大的数据速率下变得难以维持加速器开始受到更多的商业关注。数据中心运营商采用了不同的方法来加速学习(建立模型嘚行为)和推断(使用模型进行预测的行为)的工作负载(ML.He等)请参阅具有加速硬件和专用网络的服务器系统,以将加速作为可人工智能服务器并提供所有大型数据中心运营商可人工智能服务器的全面概述[8]。

许多学习系统都基于NVIDIA GPU构建NVIDIA具有学习参考设计(DGX-1)。Facebook开发了一個开放计算平台Big Basin用于学习数据中心的任务。许多公司也在开发专门针对学习的加速器Tang维护了针对ML 68的硅/ IP解决方案列表。在大型商业供应商中NVIDIA Volta芯片和Intel Nervana(正在开发中)和Movidius芯片是用于学习的DSA的示例。尽管NVIDIA努力将所有ML活动都集中在基于GPU的体系结构上但英特尔提倡一种跨多种类型的计算元素的异构方法。英特尔还提供了将x86 CPU与FPGA结合在一起的平台类似地,Xilinx也有一个异构的学习加速产品Everest该产品结合了FPGA,通用CPU和针对鉮经网络处理进行了优化的网络与任何新兴领域一样,机器学习初创公司也吸引了大量的风险投资Wave Computing和Graphcore 是具有特定领域的定制化硅片公司的范例。

虽然学习通常是一种离线活动但是推断工作负载需要对生产环境中实时数据不断进行的。因此它发生在从网络数据中心到網络边缘和终端设备的多个物理位置上。今天与学习相比,推理具有更多的性能、吞吐量和延迟约束推理也可以在降低精度的情况下執行,例如用8位、4位甚至1位精度代替32位用整数精度代替浮点数。因此学术界和工业界都开发了许多以推理为目标的加速器。Sze等人提供叻一个全面的调查学术和商业的努力以加速推论与领域特定的硬件。NVDLA是NVIDIA开发的一个用于加速推断的开源框架能够支持多种类型的硬件加速器。Tensorflow是谷歌在生产数据中心广泛使用的最著名的推理加速器Cambricon的加速器针对稀疏神经网络中推理时减少的数据流进行了优化,在不牺牲性能的前提下通过学习后修剪(或减少)神经网络来构建加速器。

比特币挖掘和加密货币挖掘通常是一项计算密集型活动在其发展的早期,比特币挖掘是在CPU上执行的早期的加速工作集中在GPU和FPGA的开采上。用于挖掘加密货币(主要是比特币)的专用集成电路获得了大量投资主偠是因为它们提供了比FPGA和GPU更好的电源性能。这些ASIC加速了加密货币中的散列操作Taylor很好地概述了加密货币挖掘的最新发展。Bitcoin Wiki还提供了加密货幣ASIC的良好概述货币矿工的一个独特的方面是,它们几乎总是部署为具有多个加速器的阵列

除了ML和加密货币挖掘之外,许多公司还生产叻DSANetronome已生产出了几代用于网络功能的DSA,用于智能网卡和网络设备的NFPThinCI最近为物联网应用引入了一种图形流处理器,用于处理多个并行数据鋶Memcached是一个分布式内存缓存系统,旨在降低磁盘访问的成本LegUp computing开发了一个memcached加速器,部署在连接了FPGA的Amazon服务器上来自HPE的作者提出了用于Memcached的SoC加速器,该加速器将在SmartNICs上实现最近受到广泛关注的一个新领域是用于近内存计算的加速器。这些加速器旨在通过将处理元素移动到外部/内蔀内存接口附近来减少系统总线上的内存流量IBM讨论了在超级计算应用程序中使用近内存处理,HPE讨论了在“机器”体系结构中使用近内存處理

与行业一样,ML在学术界也进行了大量研究对于神经网络加速研究,FPGA尤其是沃土Guo等人提供了对加速FPGA的多个主要学术研究的综述。學术研究也集中在加速神经网络的特定特性上例如稀疏性。神经网络的类型例如HMM ;开发新方法以在加速器的神经网络中存储权重矩阵。上面提到的调查文件还对用于推理的学术硬件加速器进行了很好的概述在将数据从内存传输到执行逻辑时,神经网络加速器会花费大量时间(和硅片面积)研究人员已经研究了如何通过将执行逻辑直接合并到内存中或内存接口来降低这些成本。通常在内存中执行需偠降低神经网络的复杂性。

近内存/内存内加速可能带来的性能改进受到了学术界的高度关注加速器的重点是减少内存密集型应用程序中涉及的数据传输。例如减少了在内存中遍历树的时间,降低了散列的成本对数据库所需的连接操作进行排序,以及将可重新配置的逻輯直接放在DRAM接口上

不出所料,DSA在学术界的应用范围比商业应用更广Lindsey等人研究了领域特定的语言和Monte Carlo模拟的加速器。Ng等人的综述了二十年來用于遗传序列比对的FPGA加速器的发展Wu等人提出了Q100数据库加速器。来自韩国的研究人员最近提出了一种LZ压缩的加速器

研究人员还研究了許多与构建加速器有关的有趣话题。这些努力旨在降低FPGA或ASIC中实现的加速器的开发成本Lindsey等人表明,如果可以减少开发加速器的成本(例如通过在较早的硅工艺节点上开发加速器),则可以通过在数据中心中部署自定义ASIC云来降低应用程序的总拥有成本有趣的学术焦点一直集中在开发加速器的框架上。Cong等讨论了实现主机和加速器内存之间的内存一致性的框架Celerity 和Basejump 是基于多核体系结构的开源加速器框架,其中內核是基于开源RISC-V ISA的轻量级内核Gray还演示了在FPGA上基于多核RISC-V的实现。通常加速器需要硬件和软件的协调开发。COSMIC是一个试图在横向扩展框架中囲同合成神经网络加速器的硬件和软件的框架LSSD是一个用于从多个内核自动组成架构的框架。Moorthy和Gopalakrishnan 提出了一种针对FPGA的服务框架其中定制逻輯可以放入一个框架,该框架提供任何加速器所需的I / O和内存访问他们估计这将大大减少开发工作。ST-Accel是一款专注于流媒体应用的加速器合荿工具

研究人员还将重点放在创建特定领域的语言作为一种机制来表达和抽象用于加速的原语。DSL也成为一种无需大量开发工作即可跨多個实现移植应用程序工作负载的机制P4是学术界提出的一种特定领域的语言,用于描述已经受到学术和商业关注的网络数据平面最初,P4Φ的工作重点是描述网络交换机中的流量最近的研究表明,P4作为加速器的抽象层和网络端点的可移植性也具有重要的价值

一项值得注意的新工作是,基于Google的Tensorflow语言创建一个VM环境以在软件中执行神经网络工作负载[56]。这种方法与eBPF VM相似eBPF VM用于在Linux内核中启用自定义网络。Netronome最近展礻了将eBPF执行透明地移植到加速器的能力而无需开发人员专门为加速而做任何工作。Tensor虚拟机在将神经网络工作负载透明地移植到加速器中吔可以提供类似的好处

开放领域特定架构(ODSA)

除了应用意识,有效的DSA设计是垂直集成的硅设计需要理解DSA本身的固件开发人员所需的编程模型,以及DSA如何集成到系统级应用程序数据流和控制管理中

ODSA基于一个参考的多裸片体系结构,该体系结构认识到支持集成开发的必要性咜源于一个参考的单片加速器设计,而单片加速器设计又基于广泛应用的加速器中常见的元素多裸片参考设计的目的是保护软件模型不受单片加速器的影响。这是通过新的跨裸片链接层实现的该层在多裸片加速器中抽象出了新的片间连接。参考多裸片结构基于参考单片加速器结构该结构包含了广泛的商业和学术加速器中的元素。

研究人员的目标是明确DSA的结构特征开发自动合成DSA的方法。以下特征列表基于中的列表

通用CPU设计的核心是处理具有不同并行度和不可预测的控制流的不同应用程序。相比之下几乎所有的加速器都旨在利用并荇性和确定性控制流,这些控制流存在于特定的算法或应用程序的一系列算法中特别是基于轻线程的算法。例如在神经网络中,与单個神经元相关的计算相对简单但每个网络却需要由数千个神经元组成。

加速器中的逻辑可以分为三类:

1. 特定于算法的逻辑针对基于特萣控制流的并发性:

a、硬件并发性:大量的功能单元,每一个单元通常都有一个简单的数据路径来利用加速算法中典型的巨大并行性GPU和神經网络加速器是常见的例子。

b.特定于应用的逻辑:功能单元本身包含用于计算的特定于问题的功能单元例如,NPU可能包含位操作逻辑

c、硬接线控制流:可预测的控制流反映在一个网络中,该网络实现了单元之间的显式数据通信例如,许多神经网络加速器具有近邻阵列结構

2. 协调执行逻辑:可编程加速器中的软件通常不单独运行。 相反可编程加速器通常是与在通用CPU上运行软件协同执行的。大多数加速器包含额外的硬件以协调特定应用程序的逻辑与在主机上软件和内存:

a.通用 CPU的主机接口

b.大量的内部内存。外部存储器接口这不是特别协调的邏辑。由于内存实现在很大程度上独立于应用程序所以我们将它包括在本节中。

c、对数据结构和重用的硬件支持批量数据传输引擎和/戓代理以支持与通用CPU的内存一致性。

d.通用测试和调试硬件以支持制造和操作(在商业加速器)

片上的网络,以一条网络在芯片上的形式戓一条或多条总线连接到依赖于应用程序和独立于应用程序的逻辑

下面提出的参考设计由四个部分组成,它包含了加速器的主要部分偅要组成部分包括:

b. 每个逻辑和I/O元件上的通信代理

图2:参考单片领域特定加速器架构

互连网络可以是片上网络或一组一个或多个总线。通信代理的范围可以从简单的引擎(用于接收和传输数据)到更复杂的逻辑以维持芯片上各种逻辑元素之间的存储器一致性。应用程序本身通常被分解为运行在域加速逻辑互连网络(用于数据传输),RISC CPU和主机上的固件和软件

下表将上一节讨论的一些加速器映射到组件上:

峩们在参考单片结构的基础上,提出了一种适用于DSA的多裸片结构整体设计被分解成独立的chiplet如下:

这些chiple现在被封装在一个共同的基板上。这些chiplet必须实现通信代理以支持片间网络。

其目的是使应用程序能够在参考多裸片架构上开发和执行类似于它们在单片体系架构上的开发方式。一个额外的复杂性是不像单片IC,裸片实际上可以由不同的厂商生产

为了呈现一个类似于单片IC的开发环境,多裸片架构必须提供┅个与单片IC架构相当的内存模型和性能内存模型需要在一个开放的事务层上实现,以支持来自不同供应商的轻松互操作性最后,必须使用PHY连接技术来实现性能该技术使体系结构能够使用具有成本效益的有机基质封装技术来实现。

总之为了弥补单片实现和异构实现之間的差异,参考体系架构必须开发一个完整的协议栈解决以下问题:

1. 用三个子层移动数据的网络层

a.PHY层:物理片间通信协议

b. 链路层:物理上用于邏辑通信的协议连接裸片

c.路由层:在设备之间不直接路由事务的协议连接

2. 存储层,是ODSA中所有处理活动的基础结构

a.事务层:用于在处理元素之间迻动数据的通用事务模型

b.子层2:跨处理组件的内存管理协议

c.应用层:固件和软件以集成加速器与主机

使用这种方法,即使在设计发展的过程Φ也可以保留更高的层。本节的其余部分将开发参考多裸片架构的组件

存储层充当ODSA中计算进程之间所有通信的基础结构。主机加速器通信通过内存以及逻辑元素之间的任何通信进行ODSA通过存储事务的通用模型支持内存储管理。

在现有系统中片外通信的过程不同于片内通信的过程。在多芯片封装中跨chiplet通信需要在功能上与芯片内通信的过程相同,尽管其性能可能较低通用事务模型是PHY和存储管理协议之間的接口。通用事务模型从加速器应用程序和支持应用程序的存储事务协议中抽象出物理通信的细节本节概述了通用事务模型的要求以忣可能满足这些要求的当前协议。

加速器应用程序需要为不同的应用程序支持大范围的数据传输大小每个应用程序都有不同的延迟需求:

1.ML應用程序需要为加速器处理的每个对象传输数GB的数据。

2.在网络应用中对象大小可能在64-1500B范围内,每个对象可能需要大约1-2KB的控制数据

3.在所囿应用程序中,缓存一致性协议可能需要与缓存行一样小的极低延迟的传输

预期ODSA实现将通过组合来自多个供应商的chiplet来组装。在这样的系統中并不是所有具有通信代理的设备都具有相同的功能。其次片间物理连接的数量是一个重要的资源。规模上的异构性产生了特定的需求

1.在具有多个交换机的大型系统中,可能需要路由事务即使在链路上有缓冲区,在交换机上进行简单的路由也是可取的

2.跨越chiplet边界嘚读取和写入内存事务不应停止并阻止chiplet间链接的使用。即应该保证完成。

3.启用设备发现或注册系统列举每个chiplet的特定功能。

基于消息的拆分事务信用协议支持突发数据和大小受限的写操作可以满足这些要求。议定书的具体内容仍有待制定建议是直接使用现有协议,或鍺作为开发的起点具体来说,使用PCI Express和新的开放式磁贴链接事务模型作为起点PCI-Express具有广泛应用于当前设备的优点。重用PCI Express将使ODSA能够重用大量嘚遗留裸片PCI Express具有面向设备到根传输的约束。在主机上插入PCI Express系统时可能需要与基于主机的PCI Express系统共存,增加了复杂性需要进一步的研究來完全指定通用事务模型。

ODSA将在公共事务模型上运行多种类型的内存管理协议以支持一组不同的加速器应用程序。ODSA设想在内存中支持两種类型的内存读写流

相干流: 具有相干代理的所有处理元素保持一致的硬件支持的相干存储空间视图。任何读取都将生成最新的值任哬写操作都会使物理分发的副本失效。一致性协议消耗延迟(对软件开发人员隐藏)来维护一致性状态因此,当必须保持一致性的物理區域受到限制时性能最好。与CTM层一样ODSA将重用现有的内存同步协议,如CCIX或Tyelink

非相干流:许多加速器应用程序需要可预测的大数据块传输。唎如ML的推论流需要传输大量的权重数据。非相干流可能更适合许多应用程序所需的大规模数据传输Netronome使用一种新的ISF(指令驱动的开关结构)協议来进行非相干的芯片内数据传输。该协议在分布式近邻连接上使用基于信任的链路层ODSA将支持在通用事务模型上使用ISF协议。

ODSA需要提供網络基础结构以启用通用事务处理模型

多裸片封装中的chiplet之间的物理通信协议技术仍在不断发展。系统特定的Phy协议的选择是由性能需求和荿本约束的组合驱动的例如,对于没有显著性能要求的部件重用具有PCI Express连接性的现有裸片可能比开发具有短程SerDes连接性的新产品更经济。類似地某些功能可能演化为特定协议唯一支持的功能。例如XSR协议可能是最终光连接到系统的chiplet的标准。

如前所述ODSA建议所有Phy层协议都向哽高层提供PIPE接口。

与TileLink一样ODSA中的所有消息路由都是按地址进行的。ODSA希望同时支持静态和动态路由算法

ODSA还将支持多种类型的外部接口。这些接口通常涉及大量的模拟电路这些电路无法像数字逻辑那样从流程节点特征尺寸缩减中获益。因此它们最好作为单独的chiplet实现。

外部接口上的数据将在不支持通用事务模型的接口代理上传递每个接口的Phy层将特定于接口类型。此外这些接口的数据I/O预计将通过交换chiplet来实現,从而使它们成为系统其余部分的共用资源

1.网络接口:网络接口将作为一个独立的chiplet实现,因此网络I/O带宽可以独立于系统的其余部分进行哽改网络接口可以是光接口,也可以是电接口来自接口的数据通过标准OIF接口(如XSR)定向到开关芯片。此接口上的数据预计不会在通用事务模型上交付

2.主机接口:主机接口将是下一代PCI接口。一些应用程序可能要求加速器中的内存也与主机的内存一致因此,与网络接口不同主机接口还需要支持通用事务模型。我们期望主机接口与交换chiplet集成

3.内存接口:预计开关chiplet将支持外部内存接口。为了满足延迟和/或吞吐量需求RISC CPU和加速器chiplet可以有各自的接口。对于某些应用程序具有高带宽内存接口和高带宽USR物理层的交换chiplet可能同时满足RISC CPU和加速器逻辑的吞吐量和延迟要求。也就是说外部内存可以是通过交换chiplet访问的共享资源。

有效的DSA需要集成开发硅、系统、固件和软件与DSA开发相关的两个软件问題最近受到了很多关注:领域特定语言和卸载模型。

有两种广泛的模型可用于将功能从主机卸载到DSA即透明和定向卸载。两种型号还需要主机上的驱动程序用于从主机管理DSA。

尽管DSA是可编程的而不是固定功能的ASIC但是几乎所有的DSA都包含应用程序域特有的可编程功能。DSA的一个業务问题是需要为特定的DSA创建自定义代码而该代码不能移植到实现类似功能的其他设备上。例如一个机器学习IC的代码不可在另一机器學习IC上执行。

领域特定语言解决了这个问题这些语言指定域通用的加速原语。DSA通过将程序编译到硬件来执行DSL中的代码通过支持语言原語的高性能实现来实现性能。DSL中编写的代码可移植到任何具有DSL编译器的加速器DSL使性能与跨多个设备的代码可移植性结合起来。商业上穀歌用于机器学习的TensorFlow是最著名的DSL。TensorFlow是用于编程TensorFlow ASIC的DSLTensorFlow还用于对基于VM的便携式神经加速器进行编程。P4和eBPF这两种DSL在网络应用中得到了越来越多嘚应用。P4最初设计用于核心交换应用程序然后扩展到服务器数据中心应用程序。例如P4被用来实现Gen-Z内存聚合交换协议。eBPF被设计用来在Linux内核中定义自定义网络最近它被看作是一个简单的卸载模型。

ODSA将支持DSL的使用例如,网络应用程序的P4和eBPFODSA将利用Netronome在这些领域的开源贡献。

茬大多数加速应用中DSA上运行的数据路径与通用CPU上的数据路径耦合。在ODSA中这可能是ODSA中的RISC CPU或ODSA所连接的主机。ODSA将支持两种主机交互模型:

显式卸载数据路径编程: 加速器数据路径在功能上与主机数据路径分开加速器上的数据路径由开发人员单独编程。主机通过API控制数据路径使用主机上的显式函数调用将数据从主机发送到加速器数据路径。该模型的两个示例是Google的第一代TensorFlow ASIC和Netronome的Agilio SmartNIC上的P4编程数据路径这种方法将需偠从主机处理器到卸载数据路径的开源接口。P4 Runtime是此类接口的一个示例

隐式卸载数据路径编程: 在该模型中,加速器没有在数据路径内被調用或显式编程外部控制将执行从主机切换到加速器。大多数情况下这是由程序员在VM中开发目标功能来实现的。这种方法需要主机操莋系统提供更大的开源支持主机和加速逻辑都需要支持应用程序使用的任何DSL。通过将VM从主机移动到加速器来加速应用程序这个模型的兩个例子是Netronome的eBPF卸载和华盛顿大学的TensorFlow VM。

ODSA将支持显式和隐式的卸载数据路径编程模型

为了证明ODSA的好处,建议实现一个既支持一致性存储事务叒支持非一致性存储事务的原型为了展示开放架构的好处,ODSA将使用这些chiplet的最新版本实施PoC

ODSA建议在低成本的有机或玻璃基板上实现图4中的參考架构,其中Kandou USR作为片间连接协议在USR中,我们将实现一个相干内存协议并将ISF扩展到片间非相干事务。链路层将实现内存事务的通用模型

我们简要回顾了用于开发PoC和最终ODSA原型的chiplet。

片间的交换和主机接口将由Netronome NFP提供PoC将使用NFP-6000并使用它的四个PCIe接口来提供与其他处理元素和主机嘚连接。原型和PoC还将使用广泛的开源驱动程序集、卸载固件和NFP家族可用的主机软件

当开发完成后,我们将使用光纤来封装在第3节中讨论嘚光学解决方案

FPGA提供了可重新配置的硬件,可以在其上动态实现包括DSA在内的自定义硬件当需要大量相同的加速器时,自定义逻辑通常會更高效在许多情况下,FPGA可能是首选的解决方案包括何时可以针对特定实例优化数据路径,或者何时数据量较小或者您想在不同时間将同一芯片重用于多个DSA。对于在加速阶段之间进行数据编码的简单转换FPGA也是非常有效的,以使其他不兼容的加速器能够流在一起

二、非相干事务模型PoC

我们的目标是开发第一个ODSA PoC,主要是目前在生产或开发的裸片即不需要新的流片。PoC的目标是演示ODSA提供的抽象的价值并莋为应用程序和协议开发的平台。具体来说PoC将演示网络和推理方面的应用。

PoC将由以下组件构建:

PoC将支持以下协议堆栈:

由于NFP裸片和其他裸片之间的互连总数小于100因此很容易在有机基板上实现,然后将多裸片封装在MCM封装中利用微带线和带状线对高速信号和其他低速I/o进行咘线,6层(2+2+2)基板就可以完成布线任务今天,一个14层(6+2+6)的封装提供多达四个高速路由层是很容易做到的即使是20层(9+2+9)的包装也可以投入生产。

图5.演示系统上的网络和推理封装

注:本文摘译自ODSA工作组由半导体行业观察翻译,电子科技大学黄乐天副教授参与校正特此感谢!

*免责声明:本文由作者原创。文章内容系作者个人观点半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察對该观点赞同或支持如果有任何异议,欢迎联系半导体行业观察

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易號”用户上传并发布,本平台仅提供信息存储服务

  一、无线局域网的基本概念

  • WLAN(无线局域网)是利用无线通信技术在一定的局部范围内建立的网络是计算机网络与无线通信技术相结合的产物,它以无线多址信道作為传输媒介提供传统有线局域网的功能,能够使用户真正实现随时、随地、随意的宽带网络接入
  • 无线局域网常用的实现技术有:IEEE的802.11系列协议族、家用射频工作组提出的HomeRF、Bluetooth(蓝牙)以及欧洲的HiperLAN2协议等。以IEEE 802.11协议为基础的无线局域网在标准之争中脱颖而出成为目前事实上的占主導地位的无线局域网标准。
  • 我们常说的WLAN指的就是符合802.11系列协议的无线局域网技术

  2.无线局域网中用户的关注点

    • “产品速度怎么样能带哆少用户?”
  • 应对或者满足需求的方法
    • 一般来说单路的AP支持802.11g协议的带机数是30~50人。具体数量视环境而定视频、BT等应用情况下带机数较低,普通上网应用可以满足最多的带机数实际10-20
    • 采用两套独立硬件架构,相当于2台AP的性能这样在投资不变的前提下,可以提高至2倍的粅理带宽和带机数
    •  “你这个产品能传多远的距离?”
  • 应对或者满足需求的方法
    • AP的覆盖(100~300米)、网桥传输距离(5~10公里)、穿墙能力(1~4堵墙)具体视环境而定,一般是由设备自身发射功率、灵敏度、天线增益决定的
    • 标准规定下最高的发射功率17~20dBm
    • 接收灵敏度可扩展至-101dBm
    • 哆款高增益天线可供选择
  • 用户的需求,有两种情况
    • 你们的设备支持漫游吗
    • 能不能实现端着笔记本在校园里走,上网不掉线
  • 应对或者满足需求的方法
    • 产品应支持漫游,能满足上网浏览等移动应用的需要

   (4)认证融合

    • 全校原有的有线网络已经存在完善的认证与计费系統,新建成的无线网络能否与有线网络实现认证与计费的统一如何保证用户认证方式不变?
  • 应对或者满足需求的方法
    • 若用户已经部署过楿应设备或系统再部署WLAN设备的时候,无需改动任何的有线网络架构可以随时扩展AP来增加无线用户,并通过AP上面的交换机继续完成全网無线的802.1X认证整体网络认证统一,用户不论在有线网内还是移动到无线网内都可以做到同一套用户端软件,同一套用户名认证

   (5)无线电的辐射与干扰

    • 无线局域网接入点是无线电发射设备,会不会辐射很大对附近的人身体造成辐射危害?
    • (医疗行业)我们如果在住院大楼或门诊楼部署了无线设备之后会不会对我们的一些医疗仪器尤其是心脏起搏器造成干扰,导致其工作异常而带来医疗事故
  • 应對或者满足需求的方法
    • AP产品的发射功率一般只有50mW~200mW,远小于手机的发射功率(200mW-2W)而手机的功率级别已经是国家批准并已经证实不会对人体产生影响。
    • AP的发射功率不会对医疗设备产生影响
  •  用户的困惑或需求
    • 安全是无线最重要的问题无线可能会被截获,有没有办法防止被人截获而攻击我的网络
  • 应对或者满足需求的方法
    • 由于SSID是无线网络最基本的安全手段,但SSID一般都是在空中明文广播很容易被截获,导致网络被攻擊!
    • 不让AP广播其SSID只有合法用户输入规定正确的SSID,才能够与AP连接这样,就可以防止任何的非法用户或者好奇者能够通过截获SSID而进入网络接入层

   (7)多信道干扰

    • 校园网里如果部署了很多AP,会不会互相干扰导致工作不正常?
  • 应对或者满足需求的方法
    • 如果同一区域AP多了洏又不加控制的确会有影响。在实现无线覆盖时采用2.4GHz频段(不论是使用802.11b还是802.11g)同一区域只有3个互不干扰的子信道,如果不加以很灵活嘚信道调整很容易出现干扰(同频干扰或近频干扰)。
    • DCA(动态信道自动调整技术)可以让AP自动探测所在的环境中的信道使用情况,自動找到一个完全或者相对不干扰的信道来工作大大减少了网络的信道干扰和不稳定,同时可以提供给用户更稳定的带宽
    • DCA(动态信道自動调整技术)

   3.无线局域网的两种配置实现方案

   (1)独立性网络模式BSS

  (3)拓展服务集合

   胖 AP将WLAN的物理层,用户数据加密、认证、漫游、网络管理等功能集于一身

  (2)胖AP的局限性

  • 利用胖AP组建大、中型无线网络时,配置工作量大
  • 对网络中的胖AP进行软件升级时需要手工逐台进行升级,维护工作量大
  • 胖AP上保存着设备配置信息当设备失窃时造成配置信息泄漏
  • 胖AP难于实现自动无线盲区修补、流氓AP检測等功能

   胖AP适用于小型无线网络部署,不适用于大规模网络部署

  6.胖/瘦AP的比较

   1.无线频段的分布

  •  ISM:工业、科学和医疗频段,无需许可证只需要遵守一定的发射功率,并且不对其它频段造成干扰即可
  • MAC层分为MAC子层和MAC管理子层
  • 物理层分为三个子层:PLCP(物理层会聚协议)、PMD协议(物理介质相关协议)和物理层管理子层
  • 还定义了一个站管理子层它的主要任务是协调物理层和MAC层之间的交互

  4.WLAN其他重要协議

  • 802.11e:在现有的无线网络中加入服务品质(QoS)特性和多媒体支持。
  • 802.11f:在现有的无线网络中实现不同AP之间漫游的标准
  • 802.11i:指定 802.11 网络安全机制的 IEEE 標准。802.11i 使用高级加密标准 (AES) 分组密码 该标准还增强了密钥管理、基于 802.1X 的用户身份验证和头数据完整性。
  • 802.3af:定义了以太网供电(PoE)的实现标准雖然不是属于无线标准,但在无线中也是被常常提到的。
  • WAPI:由我国多家公司主导定制的网络安全协议采用了更先进的ECC算法,在加密算法和系统架构上都比802.11i更先进
  • 更强的障碍物穿透能力:可以使用于多堵墙壁的商务住宅、复杂房间结构的写字楼等环境中
  • 公众无线局域网設备可以工作在5.8GHz频段,频率范围为5725 ~ 5850MHz
  • 5.8GHz 频段可用带宽为125MHz划分为5个信道,每个信道带宽为20MHz
  • FHSS技术在2.4GHz频段上划分为75个1MHz的子频道接受方和发送方协商一个调频的模式,数据按照这个序列在各个子频道上进行传送
  • DSSS技术将2.4GHz频段划分为14个22MHz的信道,临近的信道相互重叠在14个信道内只有3个信道不互相覆盖。
  • DSSS在每个22MHz信道中传输的数据都被转化成一个带冗余校验的chip数据它和真实的数据一起进行传输用来提供错误校验和纠错。
  • 茬MAC层为了尽量减少数据的传输碰撞和重试发送,防止各站点无序地争用信道无线局域网中采用了与以太网CSMA/CD(载波监听多路访问/冲突检测 )楿类似的CSMA/CA(载波监听多路访问/冲突防止)协议。CSMA/CA通信方式将时间域的划分与帧格式紧密联系起来保证某一时刻只有一个站点发送,实现了网絡系统的集中控制
  • 在无线局域网的环境下MAC协议必须解决两个问题
  • 数据链路层包括LLC和MAC。
  • CSMA/CA利用ACK信号来避免冲突的发生即只有当客户端收到返回的ACK信号后,才能确认送出的信号已经正确到达
  • 工作站希望在WLAN中传送数据,如果没有探测到网络正在传送数据则再随机选择一个时間延迟后继续探测,如果WLAN中仍然没有活动的话就将数据发送出去
  • 接收端的工作站如能收到发送端送出的完整的数据则返回一个ACK数据报,洳果这个ACK数据报被接收端收到则数据发送过程完成。如果该过程没有完成则发送端等待一个时间后继续重传。
  • 解决了“隐藏终端”问題

  (1)点协调功能:PCF

  • PCF用接入点AP 集中控制整个BSS内的活动
  • PCF使用集中控制的接入算法,用类似于探寻的方法把发送数据权轮流交给各个子站从而避免了碰撞的产生
    • 例如时间敏感的业务(如分组话音)就应该使用无竞争服务的PCF
    • 对某些无线局域网,PCF可以没有

  (2)MAC访问机制:DCF方式

  • IEEE 802.11协议规定所有的实现都必须有DCF功能

  4.物理信道监听与虚拟信道监听

  •  物理信道的监听
    • 站点发送数据帧的前提之一是信道空闲,需偠先检测信道(进行载波监听)
    • 在数据帧传送过程中并不监听信道而是直接送出整个帧
    • 源站把要占用信道的时间(包括目的站发回确认幀所需要的时间)写入到所发送的数据帧的头部“持续时间”字段中,以便使其它所有站在这一段时间都不要发送数据
    • 当站点检测到正在信道中传送的帧中“持续时间”字段时就调整自己的网络分配向量NAV,NAV指出了信道处于忙状态的持续时间
  • 信道处于忙状态表示:或者由于粅理层的载波监听检测到信道忙或者是由于MAC层的虚拟信道监听指出了信道忙

   (1)虚拟信道监听方法

  • 交互过程中,假设C处于A的无线范圍内但不在B的无线范围内,C收到A发送的RTS就调整自己的网络分配向量NAV使自己保持安静
  • 假设D收不到A,但收到B发送的CTSD也调整NAV
  • A发送数据帧之湔向发送一个控制帧(请求发送RTS:Request To Send),包括源地址、目的地址和这次通信(包括相应的确认帧)所需要的持续时间
  • 若信道空闲目的站B响應一个控制帧(允许发送CTS:Clear To Send),也包括这次通信所需要的持续时间
  • A收到CTS后发送数据帧目的站收到后用确认帧ACK应答,结束协议交互
    • 协助发送数据帧的控制报文例如: RTS、CTS,ACK报文
    • 负责STA和AP之间的能力级的交互认证、关联等管理工作

  (1)帧之间的传输关系

  • 为了尽量减少冲突,CSMA/CA采鼡了一种退避机制当一个站要发送数据帧时,在以下几种情况下必须进行退避:
    • 在发送第一个帧之前检测到信道处于忙状态
  • 每一次成功發送后再要发送下一帧
  • 只有检测到信道是空闲的并且这个数据帧是它想发送的第一个数据帧时才不退避

   (3)帧间间隔

  •  所有站在完成發送后,必须再等待一段很短的时间(继续监听)才能发送下一帧这段时间的通称是帧间间隔 IFS (InterFrame Space)。
  • 帧间间隔长度取决于该站欲发送的帧的類型高优先级帧需要等待的时间较短,因此可优先获得发送权
  • 若低优先级帧还没来得及发送而其他站的高优先级帧已发送到媒体,则媒体变为忙态因而低优先级帧就只能再推迟发送了这样就减少了发生碰撞的机会。
    • SIFS(短帧间间隔)
    • PIFS(点协调控制帧间间隔)比SIFS长

  ①帧间间隔SIFS

  ②帧间间隔PIFS

  ③帧间间隔DIFS

  7.基于RTS / CTS机制的典型报文发送过程

  • Type:帧类型,如管理、控制和数据帧
  • MF:More Fregment表示当有更多分段属於相同帧时置为1
  • Retry:表示该分段是先前传输分段的重发帧
  • More:表示发送方有很多帧缓存在站中,需要发送
  • W:WEP主体帧加密类型
  • O:利用严格顺序垺务类处理发送帧的顺序
  • Address Fields(1-4):包括四个地址(其中前三个用于源地址、目标地址、发送方地址和接收方地址,地址4用于自组网络)取决于幀控制字段(To DS和From DS位)
  • Sequence Control:由分段号和序列号组成,用于表示同一帧中不同分段的顺序并用于识别数据包副本
  • Data:发送或接收的信息
  • CRC:包括32位嘚循环冗余校验(CRC)

   管理帧的格式与数据帧的格式非常类似

  管理帧少一个基站地址,因此管理帧被严格限制在一个BSS中

  控制帧較短只有一个或两个地址,没有Data域也没有Sequence域,对于控制帧关键信息在SubType域中

  • 标准无线LAN必须提供9种服务,分为两类
  • 5种分发服务:涉及到對BSS的成员关系的管理并且会影响到BSS之外的站。分发服务由基站提供
  • 当移动站进入BSS时通过这些服务与基站关联起来
  • 当移动站离开BSS时,通過这些服务与基站断开联系
  • 4种站服务:只与一个BSS内部的活动有关系在BSS内部进行,在关联过程完成之后这些服务才能用到

  2.分发服务1——关联服务

  关联(Association):移动站利用该服务连接到基站上典型情况下,当一个移动站进入到一个基站的无线电距离范围之内时该服務被用到

  关联阶段分为两个步骤:

  • 移动站向AP发送关联请求
  • AP 向移动站返回关联响应

  3.分发服务2——分离服务

  分离(Disassociation):不管是移動站还是基站,都可能会解除关联关系一个站在离开或关闭之前,先使用该服务;基站在停下来进行维护之前也用到该服务

  4.分发服務3——重新关联服务

  重新关联(Resassociation):利用该服务一个站可以改变它的首选基站,该服务支持移动站从一个BSS移动到另一个BSS 移动站从┅个AP移动到另一个AP时,需要重新进行认证和关联

  5.分发服务4——分发(Distribution):决定了如何路由那些发送给基站的帧如果帧的目标对于基站来说是本地的,则该帧将直接发送到空中否则的话,它们必须通过DS转发

  6.分发服务5——融合(Integration):如果一个帧需要通过一个非IEEE 802.11的网絡来发送并且该网络使用了不同的编址方案或者不同的帧格式,则通过这项服务可以将IEEE 802.11格式的帧翻译成目标网络所要求的帧格式

   7.站垺务1——认证服务

  认证(Authentication):任何一个移动站必须首先证明自己的身份之后才允许发送数据典型情况下,当基站接受了一个移动站嘚关联请求后基站将发送一个特殊的质询帧以确定该移动站是否知道原先分配给它的密钥(口令);移动站加密质询帧送回给基站,如果结果正确移动站就被完全接纳。

  •  解除认证(Deauthentication):如果一个原先已经认证的移动站要离开网络需要解除认证。
  • 私密性(Privacy):如果在无線LAN上发送的信息需要保密的话必须要被加密,该服务管理加密和解密
  • 数据投递(Data delivery):用于传送和接收数据IEEE 802.11的传输过程不保证可靠性,洇此上面的层必须处理检错和纠错工作

   9.无线接入过程的三个阶段

   STA(工作站)启动初始化、开始正式使用AP传送数据帧前要经过三個阶段才能够接入:

  • 主动扫描方式 (特点:能迅速找到):STA依次在11个信道发出Probe Request帧,寻找与STA有相同SSID的AP若找不到相同SSID的AP,则一直扫描下去
  • 被動扫描方式(特点:找到时间较长但STA节电):STA被动等待AP每隔一段时间定时送出的Beacon信标帧,该帧提供AP及所在BSS相关信息:“我在这里”

    当STA找到与其有相同SSID的AP在SSID匹配的AP中,根据收到的AP信号强度选择一个信号最强的AP,然后进入认证阶段只有身份认证通过的站点才能進行无线接入访问。AP一般提供如下认证方法:

     当AP向STA返回认证响应信息身份认证获得通过后,进入关联阶段

  • STA向AP发送关联请求
  • AP 向STA返回关联响应

    至此,接入过程才完成STA初始化完毕,可以开始向AP传送数据帧

    802.11MAC层负责客户端与AP之间的通信,功能包括扫描、接入、认证、加密、漫游和同步等功能

一、无线个域网的基本概念及分类

  • WPAN是为了实现活动半径小(如几米)、业务类型丰富、面向特定群體的连接而提出的新型无线网络技术
  • WPAN是一种与无线广域网(WWAN)、无线城域网(WMAN)、无线局域网(WLAN)并列但覆盖范围更小的无线网络
  • ②邻近终端之间的短距离连接:典型为1~10m 
  • ③标准无线或电缆桥路与外部因特网或广域网的连接
  • ④典型的对等式拓扑结构
  • 低速WPAN主要为近距离网络互连而设计采用IEEE 802.15.4標准
  • 其结构简单、数据率低、通信距离近、功耗低、成本低,被广泛用于工业监测、办公和家庭自动化及农作物监测等
  • IEEE 802.15.4描述了低速率无线個人局域网的物理层和媒体接入控制协议它属于IEEE 802.15工作组。
  • 高速WPAN适合大量多媒体文件、短时的视频和音频流的传输能实现各种电子设备間的多媒体通信。
  • 超宽带WPAN的目标包括支持IP语音、高清电视、家庭影院、数字成像和位置感知等信息的高速传输具备近距离的高速率、较遠距离的低速率、低功耗、共享环境下的高容量、高可扩展性等。
  • 蓝牙技术是一种支持设备短距离通信(一般10m内)的无线电技术能在手機、PDA、无线耳机、笔记本电脑及相关外设等众多设备之间进行无线信息交换,其工作于2.4GHz ISM频段数据速率为1Mbps,采用时分双工(TDD)传输方案
  • 1998年5朤爱立信、IBM、因特尔、诺基亚和东芝联合宣布了“蓝牙”计划,使不同厂家的便携式设备利用无线技术在近距离范围内相互操作;1999年7月蓝牙SIG推出了蓝牙协议1.0版
  • 源于蓝牙V1.1版的IEEE 802.15.1标准于2002年4月获批为正式标准,与蓝牙V1.1完全兼容该标准是用于WPAN的无线媒体接入控制层和物理层规范

  2.蓝牙技术组网方式1

  3.蓝牙技术组网方式2

  5.物理层的主要特性

  • 蓝牙是一个低功率的系统,工作在2.4GHz的ISM频段频段被分成79个信道,每个1MHz覆盖半径为10m
  • 使用跳频扩频技术,每秒1600跳在一个微微网中所有节点同步调频,主节点规定调频的序列
  • 支持64Kb/s实时语音具有一定的组网能仂
  • 2004年蓝牙工作组推出2.0版本,带宽提高3倍功耗降低一半

  7.MAC层的主要特性

  • 微微网采用调频分时机制,采用TDM系统主/从模式
  • 微微网支持两种邏辑信道  
    • 面向连接的同步信道,用于实时数据
    • 无连接的异步信道用于无时间规律的分组交换数据,采用确认重传机制
    • 链路管理协议(LMP)负责物理链路的建立与管理
    • 逻辑链路控制及适配协议(L2CAP)负责对高层协议的复用、数据报分割和重新组装处理与服务质量有关的需求
    • 规定了一个标准化的控制接口(HCI)
  • UWB(Ultra Wide Band:超宽带):起源于20世纪60年代对微波网络冲击响应研究,是一种使用1GHz以上带宽的无线通信技术又稱为脉冲无线电(IR)技术,UWB不需要载波而是用纳秒至微微秒级的非正弦波窄脉冲来传输数据,需占用很宽的频谱范围有效传输距离在10m鉯内,传输速率可达几百Mbps甚至更高
  • UWB是一种基于IEEE 802.15.3的超高速、短距离无线接入技术,具有抗干扰性强、传输速率高、带宽大、消耗电能低、保密性好等优势
  • 通常把相对带宽(信号带宽与中心频率之比)大于25%,而且中心频率大于500MHz的宽带称为超宽带(注意:窄带<1%宽带1%-25%,超宽带>25%)

  2.UWB的技术标准

  UWB采用基带传输而不是载波传输,脉冲信号的时域极窄(纳秒级)频域极宽(数Hz到数GHz,可超过10GHz)其中低频部分鈳以实现穿墙通信

  • UWB技术主要有两种相互竞争的标准
  • MBOA标准,主张采用多频带方式来实现UWB技术
  • DS-UWB标准主张采用单频方式实现UWB技术
  • UWB技术使用了瞬間高速脉冲,因此信号的频带就很宽可支持100-400Mb/s的数据率,可用于小范围内高速传送图像或DVD质量的多媒体视频文件
  • UWB只在需要传输数据时才发送脉冲信号的功率谱密度极低,发射系统比现有的传统无线电技术功耗低得多民用UWB设备功率是传统移动电话功率的1/100,是蓝牙设备功率嘚1/20因此UWB设备在电池寿命和电磁辐射上具有一定优越性
  • 由于UWB脉冲非常短、频段非常宽,能避免多路传输的信号干扰问题与其它无线通信技术间产生干扰的可能性大幅度降低,可与其它技术共存
  • UWB信号用传统的接收机无法接收和识别必须采用与发端一致的扩频码脉冲序列才能解调,增加了系统的安全性
  • IEEE 802.15.4标准主要针对低速无线个域网制定该标准把低能量消耗、低速率传输、低成本作为目标。Zigbee标准是在IEEE 802.15.4标准基礎上发展而来的IEEE 802.15.4定义了Zigbee协议栈的最低两层(物理层和MAC层),而网络层和应用层则有Zigbee联盟定义
  • Zigbee技术主要用于各种电子设备(固定的、便攜的或移动的)之间的无线通信,其主要特点是通信距离短(10-100m)传输数据速率低、功耗低并且成本低廉。
  • FFD节点具备控制器功能能够提供数据交换,是Zigbee网络中的路由器
  • RFD节点只能与处在该星型网的中心的FFD节点交换数据是Zigbee网络中数量最多的端设备
  • 星型网络中有一个FFD充当该网絡的协调器,协调器负责维护整个星型网络的节点信息同时还可与其它星型网络的协调器交换数据,通过各网络协调器的相互通信可鉯得到覆盖更大范围,多达65000个节点的Zigbee簇型网络

  5.Zigbee物理层的主要特性

  • 省电(功耗低)  两节5号电池可用6个月至2年时间
  • 可靠  采用了碰撞避免机淛同时为需要固定带宽的通信业务预留了专用时隙,避免了发送数据时的竞争和冲突;节点模块之间具有自动动态组网的功能信息在整个Zigbee网络中通过自动路由的方式进行传输,从而保证了信息传输的可靠性
  • 延迟短  针对延迟敏感应用做了优化通信延迟和从休眠状态激活嘚延迟都非常短
  • 安全和高保密性  提供数据完整性检查和鉴权功能,加密算法采用通用的AES-128
  • 需要数据采集和监控的网点多
  • 要求传输的数据量不夶要求设备成本低
  • 要求数据传输可靠性高、安全性高
  • 设备体积很小,不便放置较大的充电电池或者电源模块
  • 地形复杂、监测点多、需要較大的网络覆盖
  • 现有移动网络的覆盖盲区
  • 使用现存移动网络进行低数据量传输的遥测遥控系统
  • 使用GPS效果差或成本太高的局部区域移动目标嘚定位应用

  10.WPAN相关技术比较

第三部分、无线城域网WMAN

一、无线城域网的基本概念

  • 无线城域网可提供“最后一英里”的宽带无线接入(固定嘚、移动的和便携的)在许多情况下,无线城域网可替代现有的有线宽带接入可称为无线本地环路
  • 无线城域网共有两个正式标准
  • WiMAX是一項新兴的宽带无线接入技术,能提供面向互联网的高速连接数据传输距离最远可达50km
  • WiMAX还具有QoS保障、传输速率高、业务丰富多样等优点。 WiMAX的技术起点较高采用了代表未来通信技术发展方向OFDM/OFDMA、MIMO等先进技术,随着技术标准的发展 WiMAX逐步实现宽带业务的移动化,而3G/4G/5G则实现移动业务嘚宽带化两种网络的融合程度会越来越高。
  • 在IEEE 802.16活动中主要的工作都围绕空中接口展开
  • 在IEEE 802.16e的网络由用户站(SS)、基站(BS)、认证和业务授权服务器(ASA)组成,ASA服务器实际上是AAA服务器提供认证、授权和计费等功能
  • IEEE 802.16e中定义了U、IB和A接口,空中接口是指BS和SS之间的接口IEEE 802.16标准仅规范数据控制平面
    802.16e先后兼容802.16d,其它情况无法先后兼容
  • 在多址方式方面,802.16d在上行采用TDMA(时分多址)下行采用TDM(时分复用)支持多用户传输。另一种哆址方式是OFDMA以2048个子载波的情况为例,系统将所有可用的子载波分为32个子信道每个子信道包含若干子载波。多用户多址采用和跳频类似嘚方式实现只是跳频的频域单位为一个子信道,时域单位为2或3个符号周期
  • 需要大段毫米波频谱,工作在10-66GHz频段的毫米波进行直线传播對建筑物或树这样的障碍物无穿透能力,要求基站和用户站是视距(LOS)链路限制了基站的覆盖范围。
  • 信号强度随距离增加急剧衰减信噪比随距离增加而下降,因此采用三种不同的单载波调制方案:对于距离较近的用户采用QAM-64(64相正交幅度调制);中等距离的用户采用QAM-16距離较远的用户使用QPSK(正交相移键控)。
  • 为了更好使用带宽IEEE 802.16可支持TDD和FDD两种无线双工方式,TDD实际是对每一帧的时分多路复用把时隙动态分配给上行和下行流量,中间的防护时间用来切换方向
  • 采用前向纠错技术,在物理层进行错误纠正
  • CS子层是MAC层与更高层的接口,汇聚上层鈈同业务将收到的外部网络数据换换为MAC业务数据单元,传递到SAPCS可实现对ATM、IP等协议数据的透明传输
  • CPS子层实现主要的MAC功能,包括系统接入、宽带分配、连接建立和维护等接收来自各种CS层的数据并分类到特定的MAC连接,同时对物理层上传输和调度的数据实施QOS控制
  • SS子层的主要功能是提供认证、秘钥交换和加解密处理支持128位、192位及256位加密系统,并采用数字证书认证的方式保证信息的安全传输。
  • 与CSMA/CA不同IEEE 802.16采取的方式是在物理层将时间资源进行分片,通过时间片区分上下行帧长度固定(上下行两个部分),上下行的切换点通过MAC层的控制自适应调整下行在先,上行在后
  • 上行信道占用多个时隙,完成初始化、竞争、维护和业务传输等操作占用时隙数目由BS的MAC层统一控制,并根据系统要求动态改变下行消息通过广播发送,SS接收到消息后在MAC层提取检查消息的连接标识符(CID)判断出发给自己的消息。BS还可以单播和哆播的方式向一个或一组SS发送消息
  • 兼顾灵活性和公平性SS均有几号回发送数据,避免了长期竞争不到信道;每个SS只在属于自己的发送时段財发送数据可以保证任何时刻,媒体上只有一个数据流传输这种机制便于进行QOS、业务优先级及带宽等方面的控制。
  • 自动请求重传机制(ARQ)接收端正确接收后发送确认信息ACK,否则发送否认信息NACK
  • 混合自动重传请求(H-ARQ)一种将ARQ与前向纠错编码结合在一起的技术,对于无法糾正的错误采用停等重传机制
  • 自适应调制编码(AMC),根据信道情况的变化动态调整调制方式和编码方式
  • IEEE 802.16是第一个提出在MAC层提供QOS保证的无線接入标准为满足高速多媒体业务对延迟、带宽、丢失率等指标的更高要求,定义了一系列严格的QOS控制机制(均基于连接进行)为不哃业务提供不同的质量服务
  • 可以根据业务的实际需要动态分配带宽,为了更好控制上行数据的带宽分配标准定义了四种不同的业务,对應四种上行带宽调制模式
  • 非请求的带宽分配业务:用于恒定比特率的服务
  • 按时轮训业务:周期性分配可变长度上行带宽和位速率可变的实時服务
  • 非实时轮训业务:不定期分配可变长度上行带宽和位速率可变的非实时服务
  • 尽力而为业务:尽可能利用空中资源传送数据但不会對高优先级的连接造成影响,尽力投递服务

一、移动自组网的基本概念

1.移动自组织网络MANET的初衷

  • 移动自组网(Mobile AdHoc NetworkMANET)是由一组带有无线收发装置的移动节点组成的一个无线移动通信网络
  • MANET它不依赖于预设的基础设施临时组建
  • MANET网络的移动节点利用自身的无线收发设备交换信息,当相互之间不在通信范围内时可以借助其它中间节点来实现通信。中间节点帮助其它节点中继时向接收前一个节点发送的分组,然后再向丅一个节点转发以实现中继所以也称为分组无线网或多跳网
  • MANET网络中每个终端可以自由移动、地位相等
  • MANET是一个多跳、临时、无中心网络
  • 可鉯在任何时候、任何地点快速构建

3.移动自组网发展历史

  • 20世纪70年代分组无线网(PRNET
  • 1983年的抗毁自适应网络(SURAN
  • 1994年的全球移动信息系统(GloMo
  • 无固萣基础设施组网,支持动态配置和动态流控、网络协议是分布的
  • 允许节点发生故障、离开网络或加入网络具备动态搜索、定位和恢复连接能力是MANET得以实现的基本要求,设计实现十分困难用于固网的很多通信机制都无法用于MANET
  • 拓扑结构动态变化(节点加入和退出频繁、节点夲身的移动性),要求路由协议重新配置路由信息的机制反应迅速且开销小使网络状态变化频繁和不可预测,要做到对网络状态的优化較难
  • 节点能力有限节点依靠电池提供能量,能量决定节点的生存期过分消耗节点能力会导致节点退出网络会使网络分割,影响网络的連通性因此路由选择要综合考虑对能量进行优化
  • 无线链路带宽有限、容量可变,由于多接入、多径衰落、噪声和信号干扰出现拥塞属於正常情况

三、移动自组网的协议栈

  • 物理层:包括射频电路、调制和信道编码系统
  • 数据链路层:负责在不可靠无线链路上建立可靠和安全嘚逻辑链路。功能包括差错控制、安全(加解密)、将网络层的分组组帧以及分组重发MAC子层负责在一个区域的共享无线信道的移动节点の间分配时间-频率或者编码空间
  • 网络层:负责分组的路由、建立网络服务类型以及在传输与链路层之间传输分组,还负责分组重新路由和迻动管理
  • 传输层:提供有效可靠的数据传输服务
  • 操作系统/中间层:处理连接断开、适配支持以及无线设备中的功耗和服务质量管理
  • 应用层:处理固定和移动主机的任务分割、源编码、数字信号处理和移动环境下的场景适应

四、移动自组网的MAC协议

1.移动自组织网络MAC协议须解决的問题

  • 移动自组网没有类似于基站或是接入点(AP)的中心控制设备因此无法使用集中控制方式
  • 移动自组网的节点移动会导致信道相互改变
  • 迻动自组网是多跳网络,必须解决隐藏中端和暴露终端、资源空间重用等问题
  • 移动自组网采用两种MAC协议
  • 异步网络中每个节点都有自己的时間标准一般不划分时隙,即使划分等长的时隙其时间起点也不对准。
  • 异步MAC协议可以灵活根据数据分组大小为节点申请资源而不要受時隙大小的约束

  (1)异步MAC协议-MACA协议

    MACA协议是继CSMA/CA协议后提出的一个较为完善的自组网络接入控制协议,该协议提出的握手机制得箌了广泛应用

    在MACA协议中:

  • 发送节点首先向目标节点发起RTS若目的节点能正确收到RTS,则回复CTS表示可以接收数据分组。
  • 节点决定是否退避不再通过载波监听结果而是是否收到并解析了一个RTS或是CTS分组,如果解析到RTS则退避确保CTS正常到达;如果解析到CTS也退避,但时间长於对RTS的退避保证节点能收完数据分组;如果同时解析到RTS和CTS,则不能发送业务数据;若没解析到任何信息则发送自己的RTS并等待回复CTS握手荿功后发送数据分组,如果握手失败则根据BEB算法进行退重发。
  • 暴露终端在避开CTS后可以使用信道隐藏终端只要避开DATA就可以使用信道。

  (2)异步MAC协议-FAMA协议

  • FAMA协议的宗旨是保证节点在发送之前向获得信道的使用权从而实现无冲突的数据分组传输过程。也可看做一种动态预約机制但FAMA中的预约不要求独立控制信道,控制分组与数据分组复用同一个信道保证数据的无冲突发送
  • FAMA控制分组发送的方式包括
    • 采用RTS-CTS交互而不采用载波监听
    • 采用RTS-CTS交互及非坚持的载波监听
  • FAMA协议簇包括以下几种协议
    • FAMA-NCS协议:非坚持的载波监听机制,发送之前载波监听CTS帧远大于RTS幀
    • FAMA-NPS协议:非坚持的分组侦听机制,侦听到则退避否则接入信道
    • FAMA-NTR协议:非坚持载波监听机制与MACA中的RTS-CTS分组结合方式发送请求分组
    • FAMA-PJ协议:只针對全联通网络,不采用握手信号发送RTS后载波监听和冲突监测
  • DBTMA(双忙音监测协议)。为克服隐藏终端的影响而提出忙音多址(BTMA)和闲音多址(ITMA)协议只适应于集中控制式网络,占用总频带的极小部分发送忙音消息当中心控制节点监测到业务信道上出现信号载波时,就在忙音信道上向其所属节点广播忙音消息避免争用信道。
  • 由于忙音信息受噪声、干扰和衰落的影响而未被监测可以在忙音信道上改发闲音消息,这就是所谓的闲音多址方式
  • DBTMA对BTMA/ITMA做了改进,形成了适合无中心网络的分布接入机制除了数据信道和控制信道,DBTMA增加了两个窄带忙音:接收忙音BTr和发送忙音BTt用于指示节点在信道上接收和发送报文。

  (4)异步MAC协议-WTRP协议

  • WTRP(无线令牌环)通过建立逻辑令牌环实现对无线信噵资源的管理和应用,令牌环上的每个节点都有自己的上游节点和后继节点当节点收到上游节点发送的令牌后,开始在规定的时间内发送数据让后将令牌传送到后继节点,发送时间超出规定时间则被迫停止发送
  • WRTP允许动态加入和离开令牌环。
  • 由于自组网无基础设施的特性因而实现全忘精确的时钟同时往往要求节点配备有GPS或其它授时定位系统,或者采用分布式算法实现全网同步但这两种方法都有各自嘚局限性
  • 保证节点间的精确同步是MAC协议应用的一个重要问题
  • 同步网络中的物理信道可以进一步划分为帧和时隙,同步MAC协议中节点接入信道哃样多是依靠随机竞争方式只是接入时间一定是在时隙的开始时刻,分组的大小最好与时隙长度成倍数关系这样可以减少冲突、避免信道的浪费
  • 同步网络MAC协议对时隙分配方式一般分为三种
    • 中心分配方式(自组网不存在中心控制节点,不适用)
    • 固定分配方式(自组网节点數目可变移动性和拓扑变化性,不适用)

  (1)同步MAC协议-FPRP协议

  • 5次握手机制(Five-Phase Reservation Protocol,FPRP)采用第三种分配方式是一种应用于同步物理信道、基于竞爭接入机制的同步MAC协议。该协议实现了全分布式的无线媒介接入控制具有对网络结构的变化不敏感、灵活性和适应性高等优点
  • 通过节点間的竞争,实现了自组网中两跳范围内无冲突的广播时隙的可靠分配和调度该协议针对广播业务设计,不适用于点对点业务

  (2)同步MAC协议(E-TDMA协议)

  • E-TDMA协议在五握手竞争机制的基础上对节点的时隙预约过程进行了改进
  • E-TDMA可以以跳邻节点预约无冲突的单播、多播个广播业务時隙,E-TDMA协议在继承了EPRP优点的基础上能够适应网络拓扑结构随机变化和带宽动态变化的要求,不受网络规模的限制提高了资源分配的灵活性,能确保QOS要求
  • RR-ALOHA协议通过每帧周期广播FI(Frame Information),使所有的邻节点都知道每一个时隙的信道使用情况FI是发送节点感知的前一帧的时隙状態信息
  • RR-ALOHA协议可提供如下服务:
    • 为单跳广播服务提供了一条无竞争的可靠的信道
  • 高带宽利用率的点对点通信
  • 最少转发节点的多跳广播服务

  (4)同步MAC协议(TBMAC协议)

  • TBMAC协议提供一种高概率限时接入信道的接入方式。与其它协议不同该协议主要考虑的性能指标是业务的接入时间,即保证节点在一定的时间内能接入信道TBMAC要求尽量减少节点间的冲突,同时在一定的时限内发现冲突并采取措施防止冲突的再次发生。
  • TBMAC协议将节点覆盖区域划分为若干小区每个小区分配一个子信道,从未降低冲突产生的概率为了进一步减小冲突,还可以将小区划分為字小区
  • TBMAC将接入信道的过程分为两个时段,增加了在一定时段内完成信道接入过程的概率
  • TBMAC是基于时分多址的协议,每个节点均可获得┅定的带宽
  • 当小区节点数超过时隙时,易造成拥塞引起较大的接入时延;邻小区通信时,因为存在多个相邻小区可能存在与多个邻尛区同时通信的情况,信道将产生竞争造成拥塞。

五、移动自组网的路由协议

  • 移动自组网路由协议主要包括
    • 路径产生过程:根据集中式戓分布式的网络状态信息和用户业务需求生成路径网络状态信息和用户业务状态信息的收集与分发是该过程的主要内容
    • 路径选择过程:根据网络状态信息和用户业务状态信息选择最恰当的路径
    • 路径维护过程:对所选择路径进行维护
    • 移动自组网路由协议还需要具有以下特点
    • 具有自适应能力,可适应快速变化的网络拓扑结构
    • 具有可宽展性适用于大规模网络

   2.自组网路由协议需要解决的问题

  • 多跳是研究自组網路由协议的前提和基础,网的特性为自组网路由协议涉及提出了新的问题和挑战:
  • 2、动态变化的网络拓扑结构
  • 3、有限的无线传输带宽
  • 4、無线移动终端的局限性

   3.自组网路由协议的任务

  监控网络拓扑结构的变化

  • 产生、维护以及取消路由

   4.自组网路由协议的要求

  • 收敛迅速:对拓扑结构的变化具有快速反应能力在计算路由时能够快速收敛,及时获得有效的路由避免出现目的节点不可达的情况
  • 提供无環路由:相比有线网,自组网更容易产生路由环路无环路由更加重要
  • 避免无穷计算:链路失效经常发生,必须避免无穷计算不采用或妀进会出现无穷计算算法
  • 控制管理开销小:传输控制管理分组也会消耗一部分带宽资源,需尽量减少控制管理开销
  • 支持单向信道:自组网鈳能经常出现单向信道支持单向信道是路由算法基本要求
  • 尽量简单实用:简单有助于提高可靠性,有助于减少各种开销路由应力求简單
  • 按需路由协议也称为反应式路由协议、源启动按需路由协议。需要路由时由源节点创建拓扑结构和路由表内容是按需建立的

我要回帖

 

随机推荐