0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【CHI】独占访问

冬至子 来源:子墨祭 作者:子墨祭 2023-10-31 14:11 次阅读

1. overview

独占访问的原则是,执行独占序列的逻辑处理器(LP)执行以下操作:

对一个地址执行exclusive load
计算要存储到该位置的新值。
对该地址进行exclusive store。
支持对可嗅探(snoopable)和不可嗅探 (non-snoopable)的内存位置进行独占访问。

如果地址A在Exclusive Load之后被另一个LP更新了,那么在执行Exclusive Store时必须失败。在这种情况下,该store操作不能完成,即store的数据无法写入到A地址。
以下是exclusive terms

翻译一下,就是:

Exclusive Load

是用于描述LP执行特定的程序指令的行为,如LDREX,该操作包含:

1.获得想要执行exclusive操作序列的地址的数据;

2.指示LP开始执行exclusive sequence;

CPU的行为)

Exclusive Load transaction

如果数据没有在LP的cache中存在,就需要发送一笔Exclusive Load transaction来获取用于Exclusive Load的数据。

所以,但是不是每一笔Exclusive Load要求一笔Exclusive Load transaction。

(总线行为)

Exclusive Store

是用于描述LP执行特定的程序指令的行为,如STREX,该操作包含:

决定是否exclusive sequence失败还是成功;
如果可以的话,更新地址所在的数据;
另外,执行的处理器(LP)知道Exclusive Store是成功还是失败的,如果Exclusive Store失败,那么地址所对应的数据不能被更新,并且Exclusive sequence必须重新开始。

(CPU的行为)

Exclusive Store transaction

用于描述interface发送一笔transaction来完成需要的Exclusive Store。不是每一笔Exclusive Store都需要一笔Exclusive Store transaction,一笔Exclusive Store transaction成功与否可以通过transaction response的RespErr域段告知LP;(有两个特殊,后面详细描述)

(总线行为)

2.Exclusive monitors

可以采用exclusive monitor来追踪exclusive sequence的进行。monitor的位置和为了支持exclusive accesses需要产生的request type是依赖于地址的内存属性。

例如,如果requester和monitor之间存在cache,那么独占访问应该是non-snoopable的。

2.1 Snoopable memory location

对于Snoopable memory地址的exclusive访问,需要采用两个monitor:
LP monitor:
RN-F内的每个LP都必须实现一个exclusive monitor,用于检查exclusive sequence访问使用的地址信息。LP在执行Exclusive Load时,LP monitor置位;LP monitor在以下情况会复位:

LP收到同地址的invalidating snoop request,表明该地址已经被其它LP更新了;(即:本LP的独占序列被破坏,独占访问失败)
同一个LP对该地址产生的store(即:本LP的独占序列完成,独占访问成功)。如果store是由同一个LP采用non-exclusive命令产生的,monitor的复位是由实现具体决定的;
PoC monitor:
HN-F必须实现一个PoC monitor,用于判定Exclusive Store transaction的结果是成功还是失败。如果成功,表明该transaction已经对其它一致性RN-F可见(通过snoop将其他RNF的cache line失效了)。如果失败,表明该transaction没有对其它一致性RN-F可见,因此Exclusive Store不能成功;
该monitor用于保证来自一个LP的Exclusive Store transactions的成功只有在该LP没有接收到一笔同地址的snoop transaction,该snoop transaction是由其它RN-F对同地址的Exclusive Store产生的;
对PoC monitor的最低要求就是它能记录任何LP对Snoopable地址产生的exclusive sequence;

如果一个LP已经执行一笔exclusive sequence相关的transaction,然后在其它LP成功的执行Exclusive Store transaction之前,该LP先执行了Exclusive Store transaction,那么该Exclusive Store transaction必须成功;(意思就是独占序列没有被破坏,就独占访问成功了)

该monitor要支持并行监控系统中所有支持exclusive能力的LP;(也就是每个LP都要有在monitor中有一个独立的条目进行监控)
当HN-F收到一笔和Exclusive Load或Exclusive Store相关的transaction后,该monitor会注册/记录LP正尝试一个exclusive sequence;
当HN-F收到一笔Exclusive Store transaction:

如果PoC monitor中已经记录了该LP正在执行exclusive sequence,(即monitor对该LP的某地址的独占标记还在),也就是说该LP的exclusive sequence还没有被其它Exclusive Store transaction给复位掉,那么该Exclusive Store肯定成功并且允许继续进行处理。在这种情况下,其它LPs的相关注册都应该被复位,CHI协议建议但不要求PoC monitor对于已经成功的LP的注册仍然保留;
如果PoC monitor没有注册LP正在进行的exclusive sequence,也就是说LP的注册位已经被其它LP的Exclusive Store给复位了,那么该LP的Exclusive Store transaction失败且不允许被继续处理。但是PoC monitor必须注册该LP的正在进行exclusive sequence。
注意:

1、对于一个LP,如果Exclusive Store transaction执行成功,那么该LP在PoC monitor的注册位不需要被复位,这样的话,该LP可以继续成功执行一系列的Exclusive Store transaction,直到其它LP成功执行Exclusive Store transaction。对于LP不确定的store transactions,该store transaction必须被处理为来自不同LP的访问;
2、在系统复位初始化,第一个LP执行Exclusive Store transaction可以成功,但是CHI协议不要求有这个功能。在这点上之后,所有其他LPs必须注册它们exclusive sequence的开始,才能让它们后续Exclusive Store transaction的成功进行;
3、当LP的Exclusive Store transaction成功后,其它LP的注册位都被复位掉,只有成功的exclusive store transaction的CompAck响应成功后,其它LP才可以注册新的exclusive sequence;
4、为了支持Exclusive访问Snoopable memory空间,LP monitor和PoC monitor都需要;

2.2 Additional address comparison

PoC monitor的功能通过增加一些地址比较来增强,只需要记录地址的某些bits就行,不需要全地址的匹配。这种方法可以减少其它LPs访问不同地址的Exclusive Store transaction的失败导致的风险,需要比较的地址位数由具体实现决定的。
当使用额外地址比较的monitor,在exclusive sequence(Load Exclusive or Store Exclusive)的最开始,监控的地址需要被记录下来。只有在其它地址匹配的LP成功的Exclusive Store transaction才会将其复位;
包含额外地址比较的monitor仍然包含最小1bit monitor用于监控每个支持Exclusive能力的LP。
在以下条件发生时,Exclusive Store transaction才允许继续进行:

地址monitor已经给同一个LP的匹配地址的exclusive sequence注册过,且没有被其它地址匹配的Exclusive Store transaction复位了;
最小1bit monitor已经给同一个LP的exclusive sequence注册过,且没有被其它任何值的LP的Exclusive Store transaction复位了。
--------这一段说的废话,monitor必须记录地址!

2.3 Alternatives to a PoC monitor

HN-F允许使用以下机制来代替PoC monitor来决定独占访问的结果:

一个精确的snoop filter,用来跟踪请求者在Exclusive Store处理时是否保留了cache line的副本。
通过Home的snoop,以确定requester是否仍然持有cache line的副本。
注意:在CHI Issue E之前,需要实现PoC monitor

2.4Non-snoopable memory location

对于Non-snoopable memory地址区间,使用一个monitor。
System monitor:

系统monitor会跟踪访问Non-snoopable地址空间的Exclusive访问。该monitor在有ReadNoSnp(Excl)操作时置位,会被其它同地址LP的改写而复位;
System monitor可以放置于PoS或终端设备处。因为系统中终端的数据比PoS的数目多,一般将System monitor放置于PoS处,这样可以:

减少System monitor的重复;
减少系统检测Exclusive访问失败的时间;
System monitor应该放置于可以观察到所有访问监控地址的transactions的地方。

PoS : Point of Serialization

PoC : Point of Coherence

3. Exclusive transactions

以下操作可以使用Excl bit来支持Exclusive访问:

Exclusive操作的通讯节点对有:

xclusive transaction必须使用正确的LPID值。

3.1 Responses to exclusive requests

对于Exclusive requests的响应和其它正常读写的响应类似,除了:

• ReadClean, ReadNotSharedDirty, and ReadShared Exclusive transactions:

--不能使用分离的 Comp和 data response.

--Requests不能使用 DMT or DCT.

• ReadNoSnp Exclusive transactions 不能使用 DMT.

• WriteNoSnpFull and WriteNoSnpPtl transactions,, 如果 Exclusive monitor在HN-F,且独占检测通过,不能使用DWT

下面这些exclusive transaction必须通过响应来告知通过还是失败:

• ReadClean

• ReadNotSharedDirty

• ReadShared

• ReadNoSnp

• CleanUnique

• WriteNoSnpFull

exclusive request的响应的RespErr域段可以指示exclusive操作成功与否。RespErr域值为0b01表示Exclusive Okay,即exclusive成功,RespErr域值为0b00表示Normal Okay,即exclusive失败;
只有一笔transaction的Excl置位,才可能返回Exclusive Okay响应;
不是所有的内存空间都支持独占访问。(什么样的内存空间不支持独占访问??)对于不支持Exclusive访问的地址不能回Exclusive Okay响应;
对于访问不支持Exclusive操作的地址,执行Exclusive Store是否会将数据更新到地址中是由具体实现决定的;
CHI协议建议不要对不支持Exclusive访问的地址发送Exclusive Store transaction。

ReadPreferUnique 和 MakeReadUnique不使用RespErr来确定独占操作的通过或失败。而是通过收到的数据响应状态来确定:

如果响应为shared cache状态,则表示独占访问失败;

如果响应为unique状态,requester必须使用其LP monitor状态来确定独占访问是否为通过。

下为request的Snoopable属性、相关monitor类型、exclusive失败的可能原因以及响应需求。

3.2 System responsibility

使用CHI协议实现的系统必须遵循以下原则:

为了有效处理Exclusive访问,每个LP应该包含一个monitor;
不管是使用monitor机制还是其它方法,对于所有的exclusive requests,都应该有防饥饿机制;
CHI协议建议安全exclusive访问和非安全exclusive访问独立分开处理。

3.3 Exclusive accesses to Snoopable locations

本小节描述当使用exclusive访问Snoopable地址空间时,LP需要执行的行为。

Snoopable Exclusive Load
LP使用Exclusive Load开始一次exclusive sequence。exclusive sequence的开始必须将LP exclusive monitor置位。
LP要执行一笔Snoopable地址的Exclusive访问的数据可能在local cache中已经存在了:

如果LP中该cacheline为Unique状态,CHI协议允许(但不推荐)LP执行Exclusive Load transaction;
如果LP中该cacheline为Shared状态,CHI协议允许但不要求LP执行Exclusive Load transaction;
如果LP中该cacheline不存在,CHI协议推荐LP执行Exclusive Load transaction来获取一份cacheline数据,但是允许Excl bit不置位的ReadClean或ReadShared或ReadNotSharedDirty transaction;
Snoopable Exclusive Load to Snoopable Exclusive Store
在执行完Exclusive Load之后,LP通常会计算该地址的新值,用于后续Exclusive Store存储。
CHI协议不要求LP完成一次exclusive sequence。例如,Exclusive Load获得数据可以指示旗语有没有被其它LP拿走了,如果被拿走了的话,则不能改变该值直到其它LP释放了该旗语。因此,新产生的exclusive sequence不需等待当前exclusive sequence的完成。
在Exclusive Load和Exclusive Store之间,LP exclusive monitor必须监控该地址的数据来判断是否已经被其它LP改变了。

Snoopable Exclusive Store
同一个LP不允许和任何注册且正在执行exclusive sequence的transaction同时执行Exclusive Store transaction。在发送一笔Exclusive Store transaction之前,LP必须等到任何这样的transaction的message已经交换完,或者接收到RetryAck响应。LP正在执行的已经注册的transactions的exclusive sequence有:

Exclusive Load transactions to any location.
Exclusive Storetransactions to any location.
当LP正在执行Exclusive Store时,需要以下操作:

如果LP exclusive monitor已经被复位了,那么Exclusive Store必须失败,且LP不能发送Exclusive Store transaction。LP必须重新开始exclusive sequence;注意:当LP monitor被置位了,不能发送最终失败的Exclusive Store transaction,避免不需要的无效掉cacheline数据。
如果cacheline为Unique状态,且LP exclusive monitor置位,那么Exclusive Store已经PASS了,不需要发送Exclusive Store transaction就可以更新该地址的数据;
如果cacheline是Shared状态,且LP exclusive monitor置位,那么LP必须发送一笔Exclusive Store transaction。必须使用Excl比特置位的CleanUnique transaction。LP exclusive monitor必须继续监控在CleanUnique执行过程中,该数据没有被更新。
CleanUnique transaction将会受到Normal Okay或者Exclusive Okay响应。
如果收到Exclusive Okay响应,意味着该transaction已经成功并且把其它RN中有该cacheline的备份失效掉。在该笔exclusive transaction完成后,LP必须再次确认LP exclusive monitor:1. 如果LP exclusive monitor置位,那么Exclusive Store成功且数据更新已经执行完成;2. 如果LP exclusive monitor没有置位,表明该cacheline在Store transaction完成之前已经被更新了,因此Exclusive Store必须失败,exclusive sequence必须重新开始;3. 如果LP无法跟踪到cacheline的exclusive状态,因为该cacheline已经驱逐掉,那么exclusive store必须失败,exclusive sequence必须重新开始。
如果收到Normal Okay响应,意味着其它LP已经完成了Exclusive Store,因此LP的Exclusive Store产生的transaction失败,不能传播给系统中的其它LPs。一笔Exclusive Store transaction以Normal Okay响应结束后,接下来可选选项有:1. 在访问完成后,LP可以检查或不检查cacheline状态,LP将Exclusive Store失败掉并且重新开始exclusive sequence;2. LP可以检查LP exclusive monitor,如果LP exclusive monitor已经被复位了,那么LP必须将Exclusive Store失效掉,并且重启exclusive sequence;3. LP可以检查LP exclusive monitor,如果LP exclusive monitor置位,LP可以再次发起Exclusive Store transaction。

3.4 Exclusive accesses to Non-snoopable locations
对于Non-snoopable的exclusive访问,有以下限制:

Exclusive access的地址必须和transaction总的bytes数对其;
Exclusive access传输总的bytes数目必须是合法数据size,即1、2、4、8、16、32bytes;
对于不遵循这些限制的行为将导致UNPREDICTABLE;
对于Exclusive read和Exclusive write transaction被认为是一对传输,必须遵守如下准则:

Exclusive read和Exclusive write的地址必须相等;
Exclusive read和Exclusive write的控制信号,即MemAttr和SnpAttr,必须相等;
Exclusive read和Exclusive write的data size必须一样;
Exclusive read和Exclusive write的LPID必须一样;
Exclusive operation的最小bytes数是transaction size决定的。System monitor可以监控更大的bytes范围,最多可达Exclusive access的最大size 64。然而,这样可能导致成功的Exclusive访问被认为是失败的,由于在exclusive传输过程中,相邻byte被改写了。
多个访问Non-snoopable memory地址的Exclusive transactions,不管是写还是读,是同一个地址还是不同地址,来自同一个LP的必须不能同时outstanding发送。
如果SN通过Exclusive ReadNoSnp的响应返回Exclusive Fail表示不支持Exclusive访问,那么如果写操作返回的是Exclusive Fail响应,其写数据仍然会被更新到地址的存储空间;
如果SN通过Exclusive ReadNoSnp的响应返回Exclusive Pass表示支持Exclusive访问,那么如果写操作返回的是Exclusive Fail响应,其写数据不会被更新到地址的存储空间。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    19155

    浏览量

    229040
  • PoC
    PoC
    +关注

    关注

    1

    文章

    67

    浏览量

    20490
  • cache技术
    +关注

    关注

    0

    文章

    41

    浏览量

    1047
收藏 人收藏

    评论

    相关推荐

    CHI架构的基础知识

    CHI架构是一个可扩展的、支持一致性的集线器接口和由多个组件使用的片上互连。根据系统要求的PPA(performance, power, and area),CHI体系结构允许组件连接的灵活拓扑结构。
    的头像 发表于 10-30 14:39 1509次阅读

    chi flat iron bowl is chi hair straightener

    if it is account the price. Obviously, the amount of a Chi Flat Iron , like any added product, differs
    发表于 10-21 22:28

    ARM系列之CHI协议介绍(一)

    1、ACE和CHI具体有什么不一样吗CHI 的全称是 Coherent Hub Interface。所以从名字就能看出,CHI 要解决什么问题了。按照惯例,开始之前放一张 AMBA 的全家福。
    发表于 04-02 14:41

    ARM系列之CHI协议介绍(二)

    1、基于CHI系统处理器的读请求开始之前,先回顾一下。一个 message 可以是 transaction request,data response,snoop request,由一个或多个
    发表于 04-06 11:17

    ARM系列之CHI协议介绍(三)

    的 transaction 通知其它主机。2、CHI支持两种形式的独占访问今天来看一下独占访问(Exclusive Accesses)。什么
    发表于 04-06 11:33

    ARM平台上特有的独占访问指令LDREX和STREX该怎样去使用呢

    来说,也在硬件层面上提供了对LL/SC的支持,LL操作用的是LDREX指令,SC操作用的是STREX指令。本文主要用来说明ARM平台上特有的独占访问指令LDREX和STREX的工作原理,以及如何使用。而
    发表于 04-22 09:44

    AHB-lite总线如何处理独占访问

    )。即使在写后将BRESP设置为2'b01。如果在启用DTCM的情况下正常工作,那么所有这些都会很好,但是那些独占式写入也会失败。还有什么需要检查的想法吗?AHB-lite总线如何处理独占访问?也许翻译中缺少一些内容?
    发表于 08-18 11:11

    AMBA CHI协议介绍

    相干集线器接口(CHI)是AXI相干扩展(ACE)协议的演进。它是Arm提供的高级微控制器总线架构(AMBA)的一部分。AMBA是一个自由的可用的、全球采用的、开放的功能块连接和管理标准在片上系统
    发表于 08-02 13:40

    AMBA 5 CHI架构规范

    CHI架构是一种可扩展、连贯的集线器接口和片上互连,可供多个组件使用。CHI架构允许根据性能、电源和区域系统要求灵活地进行组件连接拓扑。
    发表于 08-08 07:46

    SoC Designer Plus AMBA CHI协议包的用户指南

    这是SoC Designer Plus AMBA CHI协议包的用户指南。 该协议包包含用于ARM AMBA CHI协议的SoC Designer Plus事务端口接口。 ARM AMBA CHI
    发表于 08-17 07:08

    Nokia_PC_Suite_67_rel_22_chi_s

    Nokia_PC_Suite_67_rel_22_chi_sc1.rar.td
    发表于 01-19 14:15 7次下载

    MP3_chi数据手册

    MP3_chi数据手册,有需要的朋友下来看看
    发表于 08-19 17:04 1次下载

    SUPER_ROBO-EYE_Chi参数

    SUPER_ROBO-EYE_Chi参数
    发表于 01-04 13:57 0次下载

    缓存一致性验证 – AMBA CHI中的新功能

    相干集线器接口,俗称 CHI,是一种接口规范,是5千从 Arm 生成 AMBA 协议 (AMBA®® 5),于 2013 年发布。AMBA® 5 CHI 定义了用于将完全相干处理器和动态内存控制器连接到高性能无阻塞互连的接口。
    的头像 发表于 05-25 17:17 1434次阅读

    AQS独占锁的获取

    AQS提供了两种锁,独占锁和共享锁。独占锁只有一把锁,同一时间只允许一个线程获得锁;而共享锁则有多把锁,同一时间允许多个线程获得锁。我们本文主要讲独占锁。 一. 独占锁的获取 AQS中
    的头像 发表于 10-13 14:51 433次阅读
    AQS<b class='flag-5'>独占</b>锁的获取