ieee-754 相关问题

IEEE 754是最常用和广泛使用的浮点标准,特别是单精度binary32 aka浮点和双精度binary64又称双格式。

处理货币价值,将数字除以100是否安全?

在存储库代码中,在另一个团队开发的模块中,我发现有一个价格从美分到欧元的转换,只是将数字除以100.代码是Javascript,所以它......

回答 2 投票 4

将real转换为IEEE双精度std_logic_vector(63 downto 0)

这真的不应该这么困难。我想从文件中读取原始的64位IEEE 754双精度浮点数据,并在std_logic_vector(63 downto 0)中使用它。我正在使用ModelSim ......

回答 3 投票 1

对于IEEE 754浮点,double z = x-y是否保证z + y == x?

我有一个问题可以简化为这个问题陈述:给定一系列双精度,其中每个都在[0,1e7]范围内,修改最后一个元素,使得数字之和等于......

回答 3 投票 4

如何在systemverilog中控制实数的舍入模式

我想为FPU模块编写测试,但无法找到在SystemVerilog中更改实数舍入模式的方法。是否存在系统功能或任何简单方法?谢谢 ...

回答 1 投票 0

为什么IEEE 754保留了如此多的NaN值?

似乎IEEE 754标准将16,777,214个32位浮点值定义为NaN,或所有可能值的0.4%。我想知道保留这么多有用价值的理由是什么,而......

回答 3 投票 33

为什么Number.MAX_SAFE_INTEGER 9,007,199,254,740,991而不是9,007,199,254,740,992?

ECMAScript 6的Number.MAX_SAFE_INTEGER应该表示JavaScript在浮点精度出现问题之前可以存储的最大数值。但是要求......

回答 2 投票 40

为什么floor,ceil实现当x是NaN或inf时返回x + x?

我在glibc中阅读IEEE-754数学函数的实现。这是楼层实施。 float __floorf(float x){int32_t i0,j0; uint32_t i; GET_FLOAT_WORD(I0,X); j0 =((i0 >> ......

回答 2 投票 5

为什么Python中没有Inf,-Inf和NaN关键字?

在PEP 754的拒绝通知中,它声明:此PEP已被拒绝。在开放四年后,它未能产生足够的社区兴趣。这个想法......

回答 2 投票 4

如何正确实现浮点数的乘法(软件FP)

我的程序是关于一个给出浮点数的方法,在这个方法中我想要乘以或添加那些浮点数。但不要像a * b那样繁殖,我想把那些花车打破到它们的结构......

回答 3 投票 -1

如何避免具有多列的numpy数组的精确总和

我一直认为,numpy使用了一种成对求和,它确保了float32的高精度 - 操作:导入numpy为np N = 17 * 10 ** 6#float32-precision不再足够......

回答 2 投票 3

负零(-0.0)与正零(+0.0)相比的行为

在我的代码中,float f = -0.0; //否定并与负零f == -0.0f结果进行比较将为真。但浮动f = 0.0; //正数并与负零f == -0.0f进行比较,...

回答 4 投票 9

GCC的ffast-math是否具有跨平台或编译器版本的一致性保证?

我想编写跨平台的C / C ++,它在不同的环境中具有可重现的行为。我知道gcc的ffast-math可以实现各种浮点近似。这可以, ...

回答 1 投票 0

如何通过-0.0和0.0得到Python除法分别得到-Inf和Inf?

我有一种情况,即除以0.0或-0.0是合理的,我希望分别看到+ Inf和-Inf作为结果。似乎Python喜欢扔...

回答 4 投票 11

我们如何使用FP16半精度浮点数最小化精度误差

我有一个例子50.33123可以以FP32(1.8.23)格式存储为0x4249532E。如果我们将其转换为二进制0100 0010 0100 1001 0101 0011 0010 1110第一位是符号位,0表示正...

回答 1 投票 0

将MBF Single和Double转换为IEEE

跟进可用:有后续详细信息,请参阅将MBF转换为IEEE。我有一些仍在使用的遗留数据,读取二进制文件不是问题,数字格式......

回答 2 投票 1

以下x86汇编代码与FLDCW指令有什么关系?

我正在遵循这个编译的代码(我不知道编译器也没有源代码)。 Sub1:mov edx,[esp + 04h]和edx,00000300h或edx,0000007Fh mov [esp + 06h],dx fldcw word ptr [esp + 06h] ...

回答 1 投票 3

安静的NaN和信号NaN有什么区别?

我读过关于浮点的内容,我知道NaN可能来自操作。但我无法完全理解这些概念是什么。有什么区别?哪一个可以在...期间生产

回答 2 投票 72

C ++中的长两倍是IEEE二进制128的实现吗?

来自https://en.wikipedia.org/wiki/Long_double:在C ++中,long double指的是浮点数据类型,它通常比双精度更精确。但是,就像C ++的其他浮动-...

回答 2 投票 0

使用字节表示对浮点值进行排序

如果有一个8字节的数据部分并写入一个双精度浮点值,在什么条件下通过数字比较和字典的字典排序比较一致? ...

回答 2 投票 4

JavaScript中的单精度数学

我在JavaScript中重新实现了一些C代码,为了通过测试,我需要JavaScript代码返回与C代码相同的结果。 C代码专门处理单精度浮动-...

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.