将晦涩难懂的技术讲的通俗易懂
发布时间:2024-12-15 23:00:14
NCCL源码解析2——bootstrap网络初始化——lvyilong316 我们在前一部分中介绍了root进程生成ncclUniqueId的过程。ncclUniqueId数据结构中包含了root进程的监听地址和端口,用于其它进程与root进程进行连接。同时帮助root进程创建了bootstrapRoot这个线程,用于等待其他rank来传.........【阅读全文】
发布时间:2024-11-23 23:46:31
NCCL源码解析1——生成ncclUniqueId——lvyilong316NCCL 通信库通过 ncclGetUniqueId 函数生成并获取 「ncclUniqueId」。本质上,ncclUniqueId 是一个大小为 128 字节数组,如下所示。#define NCCL_UNIQUE_ID_BYTES 128typedef struct { char internal[NCCL_UNIQUE_ID_BYTES]; } ncclUniqueId;ncclGe.........【阅读全文】
发布时间:2024-11-03 18:01:11
?based Ordering;第1位表示是否支持 Relaxed Ordering; 而第 0 位表示该 TLP在经过 RC 到达存储器时,是否需要进行Cache共享一致性处理。一个TLP可以同时支持ID 基于地址的路由存储器和I/O读写请求TLP使用基于地址的路由方式,这种方式使用TLP中的Address 字段进行路由选径,最终到达目的地。l?to .........【阅读全文】
发布时间:2024-09-22 20:37:10
AllReduce 算法 通信过程:1. AllGather 阶段。优点:带宽利用率高,因为在每个通信步骤中,所有节点都在同时发送和接收数据。缺点:延迟较高,尤其是当节点数量较多时,由于需要进行 2*(N-1) 次通信。Tree AllReduce:采用树状拓扑结构进行通信 通信过.........【阅读全文】
zf8292024-11-13 13:41
zf829:您好,请教大神一个问题,设备直通给VM时,中断到底会不会导致VM_EXIT吗,如果会,那VIRTIO直通时还会导致IO性能下降吧?“当透传设备产生中断时,vfio_msihandler ISR执行,该函数不做实际的服务程序处理,仅仅通过eventfd_signal激活irqfd_inject,然后最终调用deliver_posted_interrupt向虚机注入中断,中断号即为虚机配置透传设备时的中断号。” 这段描述在代码上我也仔细看了,逻辑肯定是对的,但另一方面我还是不确定中断到底会不会导致VM_EXIT
这里的中断主要是指数据包收发的中断
回复 | 举报lemon222024-10-09 22:34
你好,有个关于实现方面的问题:当协议栈收到来自app的数据(如ping)时,会发给tun设备,然后又被发送给vpn程序,程序对其进行加密或者一些处理之后,要发送出去,这里是通过什么方式发送出去的呢?我看你关于itun/tap的文章中写的是通过socket发送给协议栈,然后自动给物理网卡后发送出去,实现来说,就是直接用socket与下一跳建立连接,然后代码用socket发送吗?那这样是不是不会再次经过TUN设备了?因为我看好像有的原理写的是再次写入到tun设备,然后tun设备给协议栈,最后再发送。
这里有点不太清楚如何具体的实现发送的
lvyilong3162023-06-06 15:06
zhangtongjian12:你好,请教下,“qemu和vhost-user前后端协商过程”中讲到的初始化多队列时,多队列初始化时,对应的kvm中断机制中irqfd和ioeventfd是和队列数目对应的吗?还是一个虚拟机就一个irqfd和ioeventfd?
和队列对应
回复 | 举报zhangtongjian122023-06-02 10:29
你好,请教下,“qemu和vhost-user前后端协商过程”中讲到的初始化多队列时,多队列初始化时,对应的kvm中断机制中irqfd和ioeventfd是和队列数目对应的吗?还是一个虚拟机就一个irqfd和ioeventfd?