compiler-optimization 相关问题

编译器优化涉及调整编译器以减少运行时或对象大小或两者。这可以使用编译器参数(即CFLAGS,LDFLAGS),编译器插件(例如DEHYDRA)或对编译器的直接修改(例如修改源代码)来实现。

我可以强制进行某些计算,尽管它们的结果没有在内核中使用吗?

我正在尝试分析我的 CUDA 内核执行的计算的某一部分的“成本”。当然,还有分析的使用。但我想确定的是...

回答 1 投票 0

禁用编译器优化。 <util/delay.h> 中的功能无法按设计运行

我正在开发 Firebird 5 模块。有 Atmega2560,我正在尝试编译此代码并收到此警告。 (基础)pawansrinivas@Pawans-MacBook-Air Experiment-3 % mkdir -p build (基地)

回答 4 投票 0

为什么不必要的原子加载没有被优化掉?

让我们考虑一下这个简单的代码: #包括 std::atomic a; 无效 f(){ for(int k=0;k<100;++k) a.load(std::memory_order_relaxed); } MSVC, Clang and GCC all p...

回答 1 投票 0

如何告诉GCC/Clang优化器生成特定的操作序列

我有一个循环需要按特定顺序执行操作序列。我在这里所做的是多次手动展开循环: 环形 { 增量 = get_delta(); sum1 += d...

回答 1 投票 0

`-O2` 在 clang 中启用哪些编译器选项?

是否有 -O2 在 Clang(对于 C)中启用的等效选项列表?我检查了文档,但它只是说“-O2 中等级别的优化,可以实现大多数优化。” 但是,...

回答 1 投票 0

如何查看 -march=native 将激活哪些标志?

我正在使用 GCC 4.3 编译我的 C++ 应用程序。我没有使用 -march=native 手动选择优化标志,理论上应该添加适用于我的硬件的所有优化标志

回答 6 投票 0

Eigen 库:返回表达式而不是向量本身

是否可以返回某种表达式,然后可以进一步使用和简化,而不是向量本身? 我有一个函数 Vector3 f(Vector3 const&, Vector...

回答 1 投票 0

C++ 中双双精度扩展精度类的浮点编译器优化问题

我在C++中实现了一个“double-double”类。 “双精度”使用两个双精度来提高精度。数字被视为 number = hi + lo,尽管总和实际上并不是

回答 1 投票 0

Visual Studio 2015 更新 3 - C++ 编译器错误?

我们观察到一个奇怪的情况,在 VS2015 Update3 中编译器会无缘无故地省略部分代码。 我们发现 这种情况发生在 VS2015 Update3 中(帮助|关于说 14.0.25431.01 Updat...

回答 2 投票 0

为什么自动矢量化器无法找到“可矢量化类型信息”?

我正在尝试对我的一些代码进行矢量化,但我不断遇到信息 C5002:由于“1305”原因,循环未矢量化。根据这个页面: // 当编译器无法执行时,会发出代码 1305

回答 1 投票 0

减少调试符号的占用空间(可执行文件膨胀到 4 GB)

所以基本问题是我构建的可执行文件大小为 4GB,并且打开了调试符号(在 75 MB 到 300 MB 之间,没有调试符号且优化级别不同)。我如何诊断/分析...

回答 3 投票 0

大多数编译器都会将 %2 转换为位比较吗?真的更快吗?

在编程中,经常需要检查一个数是奇数还是偶数。为此,我们通常使用: n%2==0 然而,我的理解是“%”运算符实际上执行除法并返回...

回答 2 投票 0

如何更好地理解 GCC 中某些指令的工作流程?

我目前正在开发一个项目,我需要更好地了解 GOMP 指令的 GCC 工作流程,我也想对源代码进行一些更改。 有没有最佳实践...

回答 1 投票 0

如何更好地理解 GCC 中某些指令的工作流程?

我目前正在开发一个项目,我需要更好地了解 GOMP 指令的 GCC 工作流程,并且我也想对源代码进行一些更改。 有没有最佳实践......

回答 1 投票 0

仅构建 GCC 后端,而不构建其他组件

我想构建具有最小依赖性的 GCC 后端而不构建其他组件,我可以获取相同的步骤吗? 我正在尝试构建 gcc 后端,但为了构建整个...

回答 1 投票 0

为什么字符串乘法的字节码不同?

我在玩字符串时遇到了以下行为: >>> 导入磁盘 >>> dis.dis('"abcdefgh" * 513') 1 0 LOAD_CONST 0 ('abc...

回答 1 投票 0

C++ 简单类大小的参数传递优化

我有一个简单的结构体 A,它代表 std::int8_t 的类型安全包装器。 A 已被简化以表示最小的可重现问题。 出于性能原因,使用 -O3 结构应该

回答 1 投票 0

如何更快地大量计算 scipy.stats.multivariate_normal.cdf() ?

我想做的是计算大量的累积正态分布函数。我只在小实例(2 个变量)上调用它,但速度慢得令人痛苦。这是我的

回答 1 投票 0

如果要立即删除,我们能否确定 Rust 会优化 clone() ?

显然,在 99% 的情况下,是否存在并不重要,只是为了帮助像我这样愚蠢焦虑的开发者晚上睡个好觉: 假设您有调用复杂库 fun 的代码...

回答 1 投票 0

在 Copy 类型中使用 std::ptr::write_volatile 实现内部可变性的安全性(即没有 UnsafeCell)

我正在尝试在复制值类型中实现内部可变性(用于缓存目的)。 问题是,据我所知,没有任何类型可用于内部可变性(例如 UnsafeCel...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.