AMD 的 GCN 和 VEGA 指令集中的 V_SUB_F64

问题描述 投票:0回答:1

为什么AMD的GCN和VEGA指令集中没有

V_SUB_F64
指令?他们是如何实现双精度减法的?

gpu opencl amd-gpu amd-gcn
1个回答
1
投票

在指令集架构文档的第 6.2.1 节“指令输入”中,它说:

使用 VOP3 形式以及使用浮点输入的指令可以选择对任何输入操作数应用绝对值(ABS 字段)或求反(NEG 字段)。

V_ADD_F64
被列为 VOP3 编码指令,因此您可以对其中一个或两个操作数取反以生成
(a + b)
(a - b)
(-a + b)
(-a - b)

© www.soinside.com 2019 - 2024. All rights reserved.