ELTV
very begining of ELTV The loop of Deep learning is divided into 4,just summarize the tricks and make a cheatsheet Extract data 针对pytorch的话,一般要实现一个dataset类,里面重写两个函数就可以了,一个是__len__,另外一个是__getitem_...
very begining of ELTV The loop of Deep learning is divided into 4,just summarize the tricks and make a cheatsheet Extract data 针对pytorch的话,一般要实现一个dataset类,里面重写两个函数就可以了,一个是__len__,另外一个是__getitem_...
最近发现tf的安装用anaconda简单了很多,和之前torch一样,不必提前装上cudatoolkit。本地的conda已经换源了。 首先创建虚拟环境 conda create -n tf python=3.8 然后需要装上cudatoolkit和cudnn,需要对应上实际的tensorflow的版本,此时我要安装的是tf-2.3.0,这两个选择对应上版本就可以了 conda i...
{ // read https://code.visualstudio.com/docs/editor/userdefinedsnippets for details "Print to console": { "prefix": "cpp", "body": [ "#include <iostream>", "#include <algorithm...
基础科目 6.S081 + 6.828:operating system 6.829computer network 6.830:database system 6.824:distributed system nju pa 应用分析 6.042:Mathematics for Computer Science 6.004:Computation St...
总结一下各类出现过的trick,针对end to end,主要分4部分, 数据输入部分的处理 backbone的创新(模块的设计,激活函数的优化) Neck Prediction 1 Data Augmentation Cutout MixUp CutMix Mosaic 2 Regulization Method dropBlock ...
v4其实在intro里就说了,很多的tricks都claims可以提点,但是大量的实验需要去验证这个问题。有些功能只对特定的模型或者特定的小规模数据集work。而另外一些tricks,比如BN,resdual connect适用于大多数的模型,任务和数据集。 其实不如把本文看作近些年OD的一个总结,验证了一些方法让OD的性能和速度提升到一个新的stage 然后在看网络结构的时候需要看到具...
v3应该是这一系列里面有创新的最后一版了(也是Joseph Redmon的最后一版),后面的v4堆了一坨优化,说创新,也谈不上。v5感觉争议比较大。 v3的行文比较像个报告,不太类似一个完整的paper,相比YOLOv2,YOLOv3最大的变化包括两点: 使用残差模型 FPN架构 前面的就是Darknet53,后面的就是和SSD很想的多尺度检测。 YOLOv3每个位置使用...
b本文先在YOLOv1的基础上提出了v2,之后提出了一种检测与分类的联合训练方法,之后在两个数据集上训练了一个YOLO9000(能检测超过9k类物体)。二者主要的模型结构是一致的 本文主要用的几个提点方法就是: BN层的加入,不再用dropout, High Resolution Classifier Convolutional With Anchor Boxes(SSD和...
YOLO,真正的single stage鼻祖。abs里面提的比较振奋了,YOLO讲目标检测作为一个回归问题。输入一张图片,一个网络做了边框的检测和里面物体的分类。后续可以直接对检测性能进行端到端的优化。得益于这种singlestage的网络框架,YOLO和之前的检测框架比,快的离谱(相对的)。然后从自然图像迁移到其他的领域的时候往往效果是优于同时间段的其他算法的,abs里写的是YOLO学到了...
SSD在v5出来之前还是有些地方用的,在v5出来之后多半就命途多舛了。 abs有一部分没看懂,直接去看了一部分conclusion,应该是利用多尺度特征图检测,感觉就是多个conv层的输出都做bbox reg和class scores。这样感觉的话较大的特征图检测小目标的话还是很有优势的,小的特征图检测大的目标就比较舒服了,23333. how it works intro提到的检测速...