分类 EDA 下的文章
前几天想将一个大小端转换的模块转成chisel,感觉挺简单,但真写起来就各种bug。
module EndianCnvt #(parameter NUMLENGTH = ...
昨天经历了恶梦debug,中间排了很多坑,特来记录一番。
一、问题描述
和队友写了lenet神经网络推理的硬件实现,在modelsim已经跑通,且验证了功能,但需要移植到...
一、为什么要锁
锁是为了防止多线访问共同内存时的冲突问题,先看实例:两个线程分别对全局变量累加:
//gcc lock_test.c -lpthread
#include...
一、线程池的好处
如果任务的数量一开始不确定,我们该如何开辟线程?如果来一个任务开辟一个线程,任务结束之后又销毁线程,那么整体的效率会很低,大多数时间都在产生和销毁线程,...
一、多核CPU的结构
服务器的多核结构属于NUMA(Non-Uniform Memory Access,非一致性内存访问)架构。这里有一篇很好的介绍NUMA架构理解。
以...
一、多核时代
随着数字IC工艺的提升,单核性能越来越高,但随之来的是功率密度增大,芯片发热严重,要进一步提升性能,很自然会想到C多核。将计算任务分配到不同的cpu,最后将...
背景
avx256是x86cpu架构下实现SIMD(单指令多数据)的指令集。它能够利用cpu内部256bit的寄存器,同时对4位double或8位int类型的数操作,达到...
C++利用内部库进行并行加速的实例,但实际效果确更慢,找不出原因。希望各路大神帮忙。
基本功能是计算$\pi$:
$$
\pi = 4\int^1_0 \frac{1}{...
利用原子指令加速矩阵运算
C++里面有个原子指令库,不需要通过内嵌汇编就可以调用cpu内部SIMD的指令,头文件 包含SSE库, 包含SSE2库, 包含SSE3库。
原子...
一、ICC综合概述
ICC(IC Compiler)是把门级网表转换成foundry厂可用于掩膜的版图信息的过程,它包括数据准备、布局、时钟树综合、布线等步骤。
ICC...
一、DC综合概述
DC(Design Compile)是将行为级(RTL)的源码转换为门级网表的过程。大体上可以分为三个步骤:
综合=转化+逻辑优化+映射
GTECH格...
理论推导可以参看图像降维之MDS特征抽取方法
样例来自Multidimensional scaling
前言
MDS的理论推导已经有很多了,基本上来自周志华老师的西瓜书,...
前言
自从入坑微电子,就接触了很多仿真软件,最开始是用Multisim,对于初学的时候还是帮助很大的,因为它很直观,只需要搭建电路——仿真即可,在刚开始学习模电的时候给了...