performance 相关问题

有关测量或改进代码和应用程​​序效率的问题。

正弦和余弦哪个更有效? Sin 和 Cos 还是 Sin 和 Sqrt?

不幸的是,标准 C++ 库没有对 sincos 进行一次调用,这为这个问题提供了空间。 第一个问题: 如果我想计算 sin 和 cos,计算便宜吗...

回答 4 投票 0

.NET 8 OnActionExecuted 和 View 开始渲染之间有 >4 秒的延迟

我知道这里有很多移动部分需要考虑,但我想我应该发帖看看是否有人有任何想法。 我遇到了视图加载时间缓慢的问题。 我添加了日志...

回答 1 投票 0

通过属性访问指针字段

在这种情况下是否可以避免属性方法调用的开销(以某种方式强制编译器内联?我知道这更像是别名,但 C# 中没有这样的东西): 不安全的公共静态类

回答 1 投票 0

高效地从 PHP 数组中选取 n 个随机元素(无需随机播放)

我有以下代码从 PHP 数组 $array 中选取 $n 元素: 随机播放($数组); $结果 = array_splice($array, 0, $n); 给定一个大数组,但只有几个元素(例如

回答 7 投票 0

我可以在每次除法发生时禁用检查零除法吗?

为了更好地理解Rust的panic/异常机制,我写了下面一段代码: #![功能(libc)] 外部箱 libc; fn 主() { 让 mut x: i32; 不安全{ x = l...

回答 3 投票 0

双 for 循环的 Python 方式

我有以下代码: 将 numpy 导入为 np epsilon = np.array([[0., 0.00172667, 0.00071437, 0.00091779, 0.00154501], [0.00128983, 0., 0.00028139, 0.00215905, 0.0009486...

回答 2 投票 0

如何更快地实现贪婪集合覆盖?

在对我原来的问题进行多次讨论后,我提出了以下贪婪集覆盖的实现。根据我收到的帮助,我将问题编码为“Greedy Set Co...

回答 3 投票 0

为什么当我增加 EC2 vCPU 时计算速度没有加快?

我必须在 MATLAB 上运行一段我无法优化的代码,所以我必须提高我的计算能力。该代码已经使用并行处理。 我已经在 ubuntu 和 Windows 上安装了 MATLAB...

回答 1 投票 0

如何通过矩阵 numpy 对循环进行向量化

假设我有一个 100000 x 100 的矩阵 将 numpy 导入为 np mat = np.random.randint(2, 大小=(100000,100)) 我希望遍历这个矩阵,如果每一行完全包含 1 或 0 我...

回答 4 投票 0

Google Colab 加载视频很慢

我是 Google Colab Pro 的客户,我用它来转录 MP4 视频。 我输入这些代码: !pip install git+https://github.com/openai/whisper.git !sudo apt update && sudo apt install ffmpeg !

回答 1 投票 0

使用 JS 创建表格的更快方法?

我正在尝试使用 Fuse 创建 JSON 数据库的前端搜索。 Fuse 非常快,但我不知道如何快速地将表格写入 HTML。 我尝试过纯JS: 为...

回答 1 投票 0

如何更有效地对矩阵进行排序?(c++)

我正在尝试对矩阵进行排序,但我的代码似乎过长、复杂且效率低下。 我确信有更好、更有效的方法来对矩阵进行排序,但尽管我努力尝试,但我找不到

回答 1 投票 0

在 Chrome 开发工具性能选项卡中使用 Performance.mark()

我希望看到我对 Performance.mark(...) 的调用显示在 Chrome 开发工具的“性能”选项卡上。我可以在网上找到的所有文档似乎都指的是不再存在的“时间轴”选项卡,而......

回答 2 投票 0

如何使 PyCharm 分析器仅显示我的源代码的计时,而不显示任何库?

当我运行 PyCharm 分析器时(这里有一个快速介绍视频 - https://www.youtube.com/watch?v=QSueV8MYtlw ),我得到了数千行,例如 hasattr 或 npyio.py (它来自哪里) ,我什至不使用

回答 2 投票 0

Wordpress 页面加载问题

在我的 WordPress 网站中,大多数页面都需要花费大量时间来加载。有时某些页面需要超过 30 秒。 我已经检查了 gtmetrix 中的速度问题。 它显示“PageSpeed Score”

回答 2 投票 0

Spark UI:如何理解 DAG 中的最小值/中值/最大值

我想完全理解min/med/max信息的含义。 例如: 总扫描时间(分钟、中值、最大) 34m(3.1秒、10.8秒、15.1秒) 所有核心的平均扫描时间为 3...

回答 1 投票 0

如何找到局部最大值

我编写了一个VBA代码来查找具有“负面影响”的特定场景数据图中的局部最大值,并且它工作得很好。然而,在稍微改变的情况下,它给了我最大值,(不......

回答 1 投票 0

ONNX I/O 绑定

我需要使用 ONNX 运行时模型的 I/O 绑定来绑定张量输入和输出。但我没有得到输出。输出张量返回 NULL 指针。我将附上下面的代码。 std::向量 我需要使用 ONNX 运行时模型的 I/O 绑定来绑定张量输入和输出。但我没有得到输出。输出张量返回 NULL 指针。我将附上下面的代码。 std::vector<Ort::Value> input_tensors; std::vector<Ort::Value> output_tensors; std::vector<const char*> input_node_names_c_str; std::vector<const char*> output_node_names_c_str; int64_t input_height = input_node_dims[0].at(2); int64_t input_width = input_node_dims[0].at(3); // // Pass gpu_graph_id to RunOptions through RunConfigs Ort::RunOptions run_option; // gpu_graph_id is optional if the session uses only one cuda graph run_option.AddConfigEntry("gpu_graph_id", "1"); // Dimension expansion [CHW -> NCHW] std::vector<int64_t> input_tensor_shape = {1, 3, input_height, input_width}; std::vector<int64_t> output_tensor_shape = {1, 300, 84}; size_t input_tensor_size = vector_product(input_tensor_shape); size_t output_tensor_size = vector_product(output_tensor_shape); std::vector<float> input_tensor_values(p_blob, p_blob + input_tensor_size); Ort::IoBinding io_binding{session}; Ort::MemoryInfo memory_info = Ort::MemoryInfo::CreateCpu(OrtDeviceAllocator, OrtMemTypeCPU); input_tensors.push_back(Ort::Value::CreateTensor<float>( memory_info, input_tensor_values.data(), input_tensor_size, input_tensor_shape.data(), input_tensor_shape.size() )); // Check if input and output node names are empty for (const auto& inputNodeName : input_node_names) { if (std::string(inputNodeName).empty()) { std::cerr << "Empty input node name found." << std::endl; } } // format conversion for (const auto& inputName : input_node_names) { input_node_names_c_str.push_back(inputName.c_str()); } for (const auto& outputName : output_node_names) { output_node_names_c_str.push_back(outputName.c_str()); } io_binding.BindInput(input_node_names_c_str[0], input_tensors[0]); Ort::MemoryInfo output_mem_info{"Cuda", OrtDeviceAllocator, 0, OrtMemTypeDefault}; cudaMalloc(&output_data_ptr, output_tensor_size * sizeof(float)); output_tensors.push_back(Ort::Value::CreateTensor<float>( output_mem_info, static_cast<float*>(output_data_ptr),output_tensor_size, output_tensor_shape.data(),output_tensor_shape.size())); io_binding.BindOutput(output_node_names_c_str[0], output_tensors[0]); session.Run(run_option, io_binding); //Get output results auto* rawOutput = output_tensors[0].GetTensorData<float>(); cout<<rawOutput<<endl; //suhail cudaFree(output_data_ptr); //suhail std::vector<int64_t> outputShape = output_tensors[0].GetTensorTypeAndShapeInfo().GetShape(); for(auto i:outputShape){cout<<i<<" ";} cout<<endl; //suhail size_t count = output_tensors[0].GetTensorTypeAndShapeInfo().GetElementCount(); cout<<count<<endl; //suhail std::vector<float> output(rawOutput, rawOutput + count); 我交叉检查了输入张量数据和形状以及输出张量。但我得到了 NULL 指针。我该如何解决这个问题。任何人都有 I/O 绑定的经验。请给我解决这个问题的提示。 试试这个 auto rawOutput = output_tensors.front().GetTensorMutableData<float>(); 而不是 auto* rawOutput = output_tensors[0].GetTensorData<float>();

回答 1 投票 0

React Native - Animated.View 与常规 View 组件之间的性能差异

使用动画组件(即 Animated.View)与使用常规组件(即,如果涉及 0 个动画,则在 React Native 中查看)是否会对性能产生影响? 代码示例: 使用动画组件(即 Animated.View)与使用常规组件(即 React Native 中的 View)如果涉及 0 个动画,是否会对性能产生影响? 代码示例: <View> <Text>asd</Text> </View> VS <Animated.View> <Text>asd</Text> </Animated.View> 我从未见过人们提到使用动画组件时对性能有任何影响,但如果没有的话,为什么 React 开发人员没有将所有组件默认设置为动画。 每当我们有一个组件经常使用内联样式更新本机视图时,使用 Animated.View 以及可选的本机驱动程序可以节省大量重新渲染。 当我们使用Animated.View时,在引擎盖后面会发生以下过程: 动画开始时,requestAnimationFrame在JS中被触发 新仓位以JS计算 JS 序列化新的位置值并将其发送到反应原生桥 在桥的另一端,Java (android) 和 C# (iOS) 对其进行反序列化并更新底层 Native View 然后框架会在屏幕上更新。 正如我们所看到的,Animated.View样式不会触发React Native组件的重新渲染,这就是为什么在这种情况下应该优先使用它们而不是<View />以避免浪费渲染。 参考:[https://tech.unacademy.com/10-ways-to-avoid-wasted-renders-in-react-native-app-part-2/][1] Animated 是一个包装器,动画。 将动画值赋予道具,以便它们可以进行有针对性的本机更新而不是反应渲染,以避免每帧的成本。 所以如果是动画的话最好使用它。如果你想在任何地方调用一次,你可以使用 if else 策略作为一个新组件👍 在 React Native 中使用 Animated.View 而不是 View 即使没有动画也会影响性能: 开销:Animated组件具有额外的动画逻辑,这会增加一点性能成本。 优化:像View这样的常规组件针对静态渲染进行了优化,使其在不需要动画时速度更快。 框架复杂性:默认将所有组件设置为动画会增加复杂性和维护问题。 结论: 仅在必要时使用动画组件以保持性能和简单性。

回答 3 投票 0

pthread 的工作负载真的需要以毫秒为单位才能使 pthread 受益吗?

我正在尝试衡量哪些工作负载的 pthread 变得有用。到目前为止,我发现工作负载需要大约 3 毫秒才能使 pthreads 对整体进度做出积极贡献(在 Alde 上......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.