neon 相关问题

NEON是ARM处理器的矢量处理指令集。

Makefile:致命错误:NE10.h:没有这样的文件或目录

[当前正在尝试制作Makefile并遇到此错误:致命错误:NE10.h:没有这样的文件或目录#include“ NE10.h” ^ ~~~~~~~编译终止我正在寻找此原因(.. 。

回答 1 投票 0

Clang ++ / g ++不在Aarch64上向量化代码

我有一个带四核Cortex-A57的SBC,并正在尝试使用编译器自动矢量化技术对Neon进行试验。在Ubuntu 18.04上同时使用clang ++(5.0.1-4)和g ++(7.4.0),下面非常简单的代码...

回答 1 投票 0

ARM NEON的SSE _mm_movemask_epi8等效方法

我决定继续进行快速弯道优化,并坚持使用_mm_movemask_epi8 SSE指令。如何使用uint8x16_t输入为ARM Neon重写它?

回答 4 投票 5

使用ARM64中的ARM Neon Intrinsic进行64位双精度值的算术运算

我正在尝试使用ARM Neon实现一个简单的64位双重加法操作。我遇到过这个问题,但答案中没有使用ARM内在函数的示例实现。所以......

回答 1 投票 0

GCC; arm64; aarch64;无法识别的命令行选项'-mfpu = neon'

我有编译错误:无法识别的命令行选项'-mfpu = neon'*当尝试使用-mfpu = neon标志进行编译时。实际上,我试过的任何'mfpu'选项都失败了。但是在文档中......

回答 2 投票 11

这个矩阵乘法码的ARMv7到ARMv8 NEON端口是什么?

// http://infocenter.arm.com/help/topic/com.arm.doc.dai0425/DAI0425_migrating_an_application_from_ARMv5_to_ARMv7_AR.pdf // p。 4-21 .macro mul_col_f32 res_q,col0_d,col1_d vmul.f32 \ res_q,q8,\ ...

回答 1 投票 0

FFMPEG与霓虹灯优化

我正在使用ffmpeg解码android上的h.264视频文件。性能非常低。我想在ffmpeg中启用氖优化以改善性能。尽管添加霓虹灯相关......

回答 1 投票 2

aarch64上未对齐的SIMD加载/存储的性能

较旧的答案表明aarch64支持未对齐的读/写,并提及性能成本,但不清楚答案是否仅涵盖ALU或SIMD(128位寄存器)......

回答 3 投票 3

霓虹64位无效:将向量与零进行比较

我想比较霓虹64位中矢量的所有16个元素,如果所有都等于零,则有一个分支。现在,我有:uaddlv h1,v0.16b umov w0,v1.s [0] cmp w0,#0 beq .exit我也试过:...

回答 1 投票 2

使用氖指令与零比较

我有以下代码if(value == 0){value = 1;使用NEON向量化指令我需要执行上述操作。如何将NEON寄存器值与0进行比较,以确保每次均等4 ...

回答 3 投票 3

访问AArch64高级SIMD中的一半寄存器

我是AArch64 Advanced SIMD(NEON)的新手,我想将AArch32代码移植到AArch64。在AArch32中,如果我想访问寄存器的较低或较高的一半,我只使用Dn而不是Qn。为......

回答 2 投票 0

使用未声明的标识符'vpaddq_u8'

我在android-ndk中使用neon,但我正面临一个问题作为主题标题。我在这里下载hello-neon演示:https://github.com/googlesamples/android-ndk这是一个演示如何在android中使用neon ...

回答 1 投票 0

opencv是否对高斯模糊使用了一些加速技术(即opencl)?

我用C ++和neon实现了我自己的高斯滤波器。伪代码:oneDimensionBlur(src,temp1,width,height)//由C ++实现transposeMatrix(temp1,temp2,width,height)//由neon实现...

回答 1 投票 0

将NEON添加到Android.mk但获取“无效地址0xe76a4080传递给free:value not allocated”

我试图在Android上运行项目,并计划在未来添加NEON代码。我运行常规代码时没有错误但是当我在Android.mk中添加NEON标志时,没有更改任何其他代码,当...

回答 1 投票 -1

如何在armv7中得到armv8中的64位Vn.8h,就像arm寄存器中的D寄存器一样?

我加载这样的数据:ld1 {v8.8h,v9.8h,v10.8h,v11.8h},[%8],#64但是当我使用数据计算时,它出错了:smlal v16.4s ,v8.2d [0],v0.h [0]错误是:/tmp/cc2h1F9Y.s:...

回答 1 投票 -1

配置GCC目标CPU

我有一个Zynq 7000目标硬件。我是一个带有NEON和VFP协处理器的双核ARM Cortex A-9。必须通过对FPEXC寄存器的写访问来启用协处理器。启用......

回答 1 投票 0

使用NEON优化ARM的卷积运算

有人可以指导我使用C中ARM Neon内在函数的优势来优化图像上滤波器的卷积吗?我已经在传统的C中实现了这个,但是,我需要时间-...

回答 1 投票 -2

ARM Cortex A53上的NEON SIMD dotproduct速度不快

我正在尝试实现一个需要计算某些数组的dotproduct的应用程序。这需要非常快,所以我考虑用Neon测试SIMD。我能够重写我的功能......

回答 1 投票 0

霓虹灯代码没有优化

我为Android NDK编写了一些简单的Neon内在函数。这是代码:float32x4_t vec1; float32x4_t vec2; float32x4_t mulneon; vec1 = vld1q_f32(&a1 [0]); vec2 = vld1q_f32(&a2 [0]); mulneon = ......

回答 1 投票 0

优化NEON XOR实施

试图xor一个巨大的uint32数组我决定使用NEON协处理器。我实现了两个c版本:版本1:uint32_t xor_array_ver_1(uint32_t * array,int size){uint32x2_t acc = vmov_n_u32(0)...

回答 4 投票 4

© www.soinside.com 2019 - 2024. All rights reserved.