sse — ответы на вопросы
-
c++ - Помогите разобраться с работой intrinsic функций в кодеНа просторах интернета нашел реализацию клеточного автомата игра "Жизнь",...
- 1
- 5
- 6 янв 2019
- lolmosk
-
ассемблер - Использование SSE инструкций в C++ коде (вычисление экспонент и логарифмов)Mожно ли использовать функции работы с SSE в с++ коде без включения ассемблерных...
- 1
- 7
- 1
- 27 янв 2019
- Zhihar
-
Как наиболее эффективно получить постоянное (целое) значение во всех 8 слотах регистра avx _m256 - sseУ меня целочисленное значение -1, и я хочу загрузить его как можно быстрее...
- 1
- 3 май 2020
- MatthiasL
-
Миграция существующей реализации websocket в реализацию sse - javaЯ думаю перенести существующую реализацию websocket в SSE. В текущей реализации...
- 3 май 2020
- TonyAdityaStark
-
-
Преобразование из индексов на основе источника в индексы на основе назначений - cЯ использую инструкции AVX2 в некотором коде C. Команда VPERMD принимает...
- 1
- 3 май 2020
- eyepatch
-
SSE4.1 автоматически помещает сравнение строк в новые gcc - c++Я искал документы gcc 4.8.1, но не смог найти ответ на этот вопрос: У меня...
- 1
- 1 май 2020
- Marco A.
-
Вызов конструктора из другого класса - c++Если у меня есть класс вроде этого: typedef union { __m128 quad; float...
- 2
- 22 апр 2020
- knight666
-
OpenMP + SSE не дает ускорения - sseМой профессор узнал об этом интересном эксперименте 3D линейно разделяемой...
- 2
- 18 апр 2020
- Sayan Ghosh
-
Программа Intrinsics (SSE) - g++ - нужна помощь - inline-assemblyЭто первый раз, когда я отправляю вопрос о stackoverflow, поэтому, пожалуйста,...
- 1
- 17 апр 2020
- Sriram
-
-
SSE целые числа сдвига - cЯ пытаюсь понять, как работает с SSE, но я не понимаю, что дает выход gdb....
- 1
- 14 апр 2020
- Nils
-
Ошибка сегментации из-за выравнивания памяти в SSE - c++Я работаю над обнаружением лица, в котором я беру ввод как файл .bmp и...
- 4
- 14 апр 2020
- kamakshi
-
Доступ к регистрационным частям мм1 - c++Можно ли получить доступ к одному байту в регистре mmx, например массиве?...
- 2
- 13 апр 2020
- Pepeluis
-
Смешивание TBB с внутренними характеристиками SSE2 - optimizationИспользует SSE2, встроенный в параллель, для хорошей идеи? Так как количество...
- 2
- 13 апр 2020
- prgbenz
-
C: Попытка иметь переменные, хранящиеся в определенных регистрах XMM - cЯ работаю над проектом с использованием встроенных SSE-регистров и регистров...
- 2
- 10 апр 2020
- mozi
-
-
Еще лучше _mm_shuffle_ps, который может принимать 3 элемента из одного источника? - x86_mm_shuffle_ps может просто скопировать 2 поплавки с a и 2 из b, правильно?...
- 2
- 30 мар 2020
- echo
-
openMP и SSE, моя программа не ускоряется - optimizationВот часть моего кода, который выполняется параллельно: timer.Start(); ...
- 1
- 30 мар 2020
- user606521
-
Использование новых sse-регистров xmm8 - xmm15 - assemblyМой вопрос короткий. Можно ли использовать новые sse-регистры из встроенного...
- 2
- 29 мар 2020
- truthseeker
-
Ошибка связи при использовании встроенной математической библиотеки в сочетании с предварительно скомпилированным...Сегодня у меня возникла довольно странная проблема. У меня есть математическая...
- 1
- 28 мар 2020
- Millianz
-
SSE2 двойное умножение медленнее, чем при стандартном умножении - c++Мне интересно, почему следующий код с инструкциями SSE2 выполняет умножение...
- 2
- 27 мар 2020
- pokey909
-
-
Использование плавающих точек с одинарной точностью - floating-pointЯ хотел бы ввести некоторые команды SSE для моего кода C++. Например, такой:...
- 1
- 27 мар 2020
- N.M
-
SSE: _mm_mul_ps не будет умножать 10001 с 10001 правильно, но отлично работает на 10000 с 10000 - x86У меня очень простая программа для умножения четырех чисел. Он отлично...
- 1
- 26 мар 2020
- Ross
-
Ошибка компиляции при выполнении SSE в С++ - x86Мой код очень прост для понимания SSE. Мой код: #include <iostream>#include...
- 1
- 25 мар 2020
- Tanvir
-
пользовательский расширенный векторный тип: например. float4 b = v.xxyz; - c++OpenCL, GCC и Clang имеют удобный векторный тип extensions. Одна из особенностей,...
- 21 мар 2020
- Z boson
-
Реализация фильтра SSE на С++ - c++Я попытался использовать SSE для работы с 4 пикселями. У меня проблема...
- 1
- 21 мар 2020
- manhon
-
-
может кто-нибудь объяснить это сравнение SSE BigNum? - sseЕсли вы посмотрите на этот ответ, автору удается создать компактный алгоритм...
- 1
- 21 мар 2020
- user1095108
-
Как добавить значения от вектора друг к другу - x86В моем коде я решаю интеграл y=x^2-4x+6 Я использовал SSE - он позволяет...
- 1
- 21 мар 2020
- DzikiChrzan
-
Обработка нулей в _mm256_rsqrt_ps() - cУчитывая, что _mm256_sqrt_ps() относительно медленный, и что значения,...
- 1
- 1
- 21 мар 2020
- Ken Y-N
-
нарушение доступа к инструкции sse - memoryЯ новичок в инструкции SSE и пытаюсь научиться этому. Я написал небольшую...
- 1
- 1
- 21 мар 2020
- ItDoesnotMatter
-
Как эффективно накапливать массивы данных в C - cПроблема в том, что у меня есть огромная матрица A и задана (довольно большой)...
- 1
- 1
- 21 мар 2020
- user1819047
-
-
x86 Assembly (SSE): Неожиданный результат умножения - assemblyСледующий код должен квантовать положительный (одинарной точности) номер...
- 1
- 1
- 21 мар 2020
- Bliss
-
Ошибка производительности в SSE SIMD-коде - performanceУ меня есть код для поворота вектора вокруг другого вектора на заданный...
- 1
- 2
- 20 мар 2020
- shamaz.mazum
-
Оценка циклов за инструкцию - performanceЯ разобрал небольшую C++ программу, скомпилированную с MSVC v140 и пытаюсь...
- 1
- 1
- 20 мар 2020
- Stradigos
-
Почему встроенная сборка GAS, завернутая в функцию, генерирует разные инструкции для вызывающего, чем...Я писал некоторые основные функции, используя GCC asm для практического...
- 1
- 1
- 20 мар 2020
- chew socks
-
Как загрузить 96 бит из памяти в регистр XMM? - assemblyСкажем, у меня есть указатель на память в rsi, и я хотел бы загрузить 12-байтовое...
- 1
- 2
- 20 мар 2020
- jacobsa
-
-
Матрица заполнения в C - cЯ пытаюсь использовать SSE для переноса моей матрицы. Но он может соответствовать...
- 1
- 3
- 18 мар 2020
- Jennifer Q
-
Умножить 4 интервала одновременно - cЯ написал функцию, которая умножает четыре ints одновременно в массиве...
- 1
- 1
- 18 мар 2020
- Nils
-
проблема с результатом _mm_cmpestri в c - cЯ пытаюсь запустить следующий код, но результат всегда равен нулю. Что...
- 1
- 1
- 18 мар 2020
- Jimbo
-
Преобразование 32-разрядного SSE-кода NASM в NASM 64-разрядный AVX - nasmЯ хотел бы преобразовать этот код из 32-разрядного SSE NASM в NASM 64-AVX....
- 1
- 1
- 18 мар 2020
- A.Berg
-
массив из C в сборке - cЯ пытаюсь сделать с SSE добавление, и я использую этот C с сборкой. Почему...
- 1
- 1
- 18 мар 2020
- demoo
-
-
Intel x86_64 сборки сравнить подписанные двойной точности поплавков - assemblyУ меня проблема по предмету. В регистре xmm0 у меня есть значение, например...
- 1
- 3
- 17 мар 2020
- formateu
-
порядок байтов в комментариях сборки xmm clang - cУчитывая следующую программу: #include "emmintrin.h"int main(int argc,...
- 1
- 2
- 17 мар 2020
- Albert Netymk
-
Сравнение SSE не работает по назначению при выполнении линейного поиска по массиву целых чисел в С++...У меня есть следующий код, предназначенный для выполнения линейного поиска...
- 1
- 1
- 17 мар 2020
- Valence
-
Загрузка регистров XMM из адреса - c++Я пытаюсь загрузить/сохранить память из/в массив указателей символов, используя...
- 1
- 2
- 15 мар 2020
- user2377766
-
Переключить аудиоканалы с помощью инструкций SIMD - x86Я использую звуковой микшер, он отлично работает без SIMD-инструкций, но...
- 1
- 1
- 15 мар 2020
- Daniel Farkas
-
-
Почему я получаю float, а не double, от scanf? - assemblyНедавно писал небольшие программы с номерами fp. Сначала я читаю double...
- 1
- 1
- 15 мар 2020
- Bulat M.
-
Как эффективно конвертировать из двух __m128d в один __m128i в MSVC? - x86Преобразует ли тогда, затем побитовое смещение - или единственный способ...
- 1
- 1
- 15 мар 2020
- G Huxley
-
Почему и где выравнивание 16 используется для выравнивания SSE для инструкций? - assemblyЯ читаю Modern x86 Assembly language book от Apress. Для программирования...
- 1
- 1
- 15 мар 2020
- Onur Gumus
-
любые способы преобразования беззнакового символа в короткий, основанный на интрисиях процессора AVX512?...Я просто читаю встроенные множества процессоров AVX512 в процессорах Xeon...
- 1
- 1
- 14 мар 2020
- pottermarkken
-
как обнулить конкретный байт в регистре xmm? - assemblyЯ хочу знать, есть ли простой эффективный способ сделать следующее данный:...
- 1
- 1
- 14 мар 2020
- poby
-
-
Правильный способ суммирования двух массивов с SSE2 SIMD в С++ - c++Начните с включения следующего: #include <vector>#include <random>using...
- 1
- 2
- 14 мар 2020
- Kim Shutter