楼主: 史海军

详解残差网络

[复制链接]

0

主题

5

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 18:59:24 | 显示全部楼层
非常好
回复

使用道具 举报

6

主题

7

帖子

19

积分

新手上路

Rank: 1

积分
19
发表于 2022-12-9 18:59:50 | 显示全部楼层
好文,写得很棒
回复

使用道具 举报

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-12-9 18:59:58 | 显示全部楼层
很干
回复

使用道具 举报

1

主题

4

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2022-12-9 19:00:15 | 显示全部楼层
我觉得前面说的跟集成模型差不多,直接映射可以理解成创造浅层模型
回复

使用道具 举报

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2022-12-9 19:01:03 | 显示全部楼层
BN是什么操作呢?
回复

使用道具 举报

1

主题

4

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2022-12-9 19:01:52 | 显示全部楼层
batch normalization
回复

使用道具 举报

1

主题

4

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2022-12-9 19:02:23 | 显示全部楼层
学到了,把BN和ReLU放到前面,确实会提高效率
回复

使用道具 举报

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2022-12-9 19:02:28 | 显示全部楼层
讲得挺好,不过应该加一些过渡,把2015年那篇论文里的分析过程也加上。比如2015年的论文里有提到为什么不用1层实现残差映射,而要用到2层。纬度映射的矩阵Ws其实也可以加到输入X上,为什么没必要加
回复

使用道具 举报

1

主题

7

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2022-12-9 19:03:11 | 显示全部楼层
误差表示观测值和真实值的区别,残差表示观测值和预测值的区别,这个写的很好。
回复

使用道具 举报

0

主题

4

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2022-12-9 19:03:41 | 显示全部楼层
您好,请问公式推导出自哪里呢?xl不是标量吧,[1]提到非标量求导,不能随便使用链式法则呀。。望解答。

[1]https://zhuanlan.zhihu.com/p/24709748
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|多点娱乐

GMT+8, 2025-10-16 16:13 , Processed in 0.177317 second(s), 21 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表