网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
成为超级会员,使用一键签到
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
05月12日
漏签
0
天
显卡吧
关注:
7,659,641
贴子:
205,546,488
看贴
图片
吧主推荐
视频
游戏
32
回复贴,共
1
页
<<返回显卡吧
>0< 加载中...
5090D可能有真有硬件锁
只看楼主
收藏
回复
xixishuile7
Adreno
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
脉冲编码调制
Mali
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
图里说aten没调好到你这怎么就是硬件锁了🧐
上海盛霄云计算技术
比格云gpu,提供gpu血清,深度学习,科学计算,图形渲染服务。专业的技术支持
2025-05-12 04:05
广告
立即查看
2025-05-12 04:05:16
广告
高频振动
Mali
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
还是5090有锁性能比较靠谱,目前各种测评90和90d性能大差不差导致价格离谱
MrLiu
Adreno
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
真的无语,这个50系,昨天跑分子动力学模拟也不兼容,我编译了好几个小时才用上
yideli2009
PowerVR
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
只要仔细看pytorch和transformers官方的发布页就知道,这两家正在几乎按天在更新支持50系的版本,所以别提什么锁不锁的。
小地雷
Mali
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
所以呢? 对于我们打游戏的来说D和不带D的有啥区别? 我们又不是来搞生产
莫布兰
Vivante
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
我就是up,已经破案了,是pytorch的linear算子bug,fp32下短时间多次调用会大幅度减速,手动重写Linear类就能恢复理论性能
截至4月4日pytorch2.8版本还没修复,且已排除gcc/g++的问题,我已经github上提交问题了,后续会持续关注
莫布兰
Vivante
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
bug复现截图,99.99%不是硬件锁,实在急着用的就把模型文件的linear手动重写下就解决了
当然我话不说死,修复前,锁的概率依然存在
2025-05-12 03:59:16
广告
颂萬財69
Voodoo
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
软锁 硬锁生产成本太高
lidoon
PowerVR
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
经典新闻学时刻。。数据上5090d vs5090出现性能下降的就只有一个swin base,是咋总结出来“可能真有硬件锁”的?总不能因为原文为了严谨性说的那句“不排除硬件锁”吧。。。
cyrilliu1974
PowerVR
10
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
硬体锁很容易实现的,要不然完全相同制程的工厂所制造出来的50打上系列晶片如何能够在出厂时分别供应给不同型号?还不就是关闭某些CUDA实现
勞資不是人
Vivante
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
搞ai绘图的,沟槽的PyTorch报错个不停,现在只能用暗夜版本
莫布兰
Vivante
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
最新消息!通过改变环境变量,可以修复Linear算子问题,在Swin模型基准测试上超过4090约100%,目前已经完全可以确定,在FP32下的训练和推理速度异常是BUG,不是锁!不是硬件锁,也不是软件锁!
结论就是在深度学习常用模型上,FP32和FP16精度下,5090D完全没有性能阉割
FP8和FP4推理已经很多人用FLUX模型测试过了,和5090速度没有显著区别。基于目前的观察,可以判断在FP8和FP4精度下,5090D也完全没有性能阉割!
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示