关键词:
存算一体
并串转换
LVDS
驱动器
接收器
摘要:
相较于传统冯诺依曼架构,存算一体(Compute-in-Memory,CIM)芯片架构能够更高效地处理各类神经网络算法,在自然语言处理和图像识别这类需要处理大规模数据的领域有着显著的优势。这类架构通过存算单元阵列搭配相关外围模拟和数字电路以实现完整芯片功能。在一些大规模存算一体芯片中使用较为复杂的以太网(Ethernet)或者外围组件快速互连(Peripheral Component Interconnect Express,PCIe)接口传输数据,但这两者结构复杂且授权昂贵。本文的存算一体芯片中卷积输出层的数据量相对较小,但对传输电路的面积和功耗要求较高,综合对比各种接口电路,采用功耗低、速率快且抗干扰的低压差分信号(Low Voltage Differential Signaling,LVDS)接口电路来实现数据传输,并重点关注功耗、面积和电路稳定性。论文的主要研究内容归纳如下:
(1)针对存算芯片中读出电路模数转换器(Analog-to-Digital Converter,ADC)量化出来的64×8位数据的传输需求,若直接并行传输将消耗大量功耗且占用大量面积。本文将数据分为四组,每一组128转1并串转换电路采用树形结构。为降低电路面积和功耗,采用了时钟反相器结构组成基本的2转1并串转换单元。但传统时钟反相器结构存在浮空节点,在传统结构上增补了一个时钟反相器和普通反相器消除了浮空节点,进一步增强了稳定性。通过2转1并串转换单元、8转1并串转换单元和64转1并串转换电路的组合,完成了128转1并串转换电路的定制化设计。
(2)针对LVDS驱动器中电源电压从3.3 V降低到2.5 V导致差模电压不稳定的问题,本文设计了差模电压反馈调节电路,再加上共模反馈调节电路,组成双负反馈回路能同时保证共模和差模电压的稳定性,即使在低电源电压各个工艺角下仍能保持较好的眼图质量。相比于传统的LVDS驱动器只需单个1.25 V的参考电压,多引入的差模电压反馈回路需要增加1.075 V的参考电压,带隙基准采用电流模结构以提供多个参考电压。针对单端转差分电路传统传输门结构差分信号难以对齐的问题,本文设计了交叉耦合的单端转差分电路实现了差分信号的强制对齐。
(3)针对LVDS接收器输入级的普通放大器在宽电压输入范围无法工作的问题,本文设计了基于1:3电流镜技术的轨对轨折叠式放大器,输入级实现了在0.25 V~2.25 V的电压输入下跨导基本恒定。为增强接收器抗干扰能力,第二级比较器通过增添内部正反馈回路实现了25 mV的迟滞电压以消除信号波动的干扰。第三级整形缓冲电路中采用施密特触发器调整输出信号以符合设计需求。
(4)本文的电路均采用65 nm标准CMOS工艺设计,完成了128转1并串转换电路、LVDS驱动器和LVDS接收器的版图设计。并串转换电路的版图面积为154×118μm2,后仿功耗为344.16μW;LVDS驱动器的版图面积为176×115μm2,后仿功耗为9.65 m W,差模电压为327 mV,抖动为46.88 ps,共模电压为1.246 V,数据输出速率1Gbps;LVDS接收器的版图面积为133×86μm2,后仿功耗为1.825 m W,共模输入电压为0.25 V~2.25 V,差模输入电压为200 mV~800 mV,信号输入速率为500 Mbps。