Хитрые, необычные алгоритмы и код

Adrift

[uquote="ПростоНуб",url="/forum/viewtopic.php?p=4644616#p4644616"]Будет много. Это лишь вопрос времени. Главное, что эти расширения документированы и для них есть кодогенерация.[/uquote]
Возьмем, для пример, STM32, там до сих STM32F1 нарасхват, а это у них первая серия среди кортексов. После того были F0/F2/F3/F4/F7/G0/G4/C0/L0/L1/L4/L4+/L5/U0/U5/H5/H7, на подходе U3 и N6. Helium есть только у последнего и это нишевый продукт с пиковой производительностью и NPU, даже через 5 лет после его выхода на один проданный N6 будут приходиться сотни мк других серий. Возможно вы удивитесь, но даже на самых простых из этих мк, где даже деления нет, не то что FPU, тоже медианы высчитывают и производительность там нужна сейчас, а не приблизительно никогда )

ПростоНуб писал(а):LLVM уже года четыре, как поддерживает RVV.

Покажите мне живой мк на RISC-V с RVV )

ПростоНуб писал(а):Но всё же, где в моем коде нахождения медианы Вы обнаружили хоть какую-то зависимость от Cortex-M или RISC-V?
Почему Вы упорно отказываетесь считать этот код универсальным для любого микропроцессора, от i4004 до AMD EPYC 9965?

А я не отказываюсь. Вопрос даже не в том какой вариант кода лучше, просто мой пузырьковый вариант, который я написал чисто ради интереса, показывает схожую производительность или даже чуть лучше. Это эмпирический факт, вы не можете его опровергнуть, у вас даже мк нужного нет для тестов. Зато можно дисквалифицировать сам мк, как устаревший, и вы снова на коне )

ПростоНуб

[uquote="Adrift",url="/forum/viewtopic.php?p=4644627#p4644627"]Возьмем, для пример, STM32[/uquote]
На STM32 свет клином сошелся?

[uquote="Adrift",url="/forum/viewtopic.php?p=4644627#p4644627"]Покажите мне живой мк на RISC-V с RVV )[/uquote]

Ну если именно "показать", то вот например:

[uquote="Adrift",url="/forum/viewtopic.php?p=4644627#p4644627"]

ПростоНуб писал(а):Но всё же, где в моем коде нахождения медианы Вы обнаружили хоть какую-то зависимость от Cortex-M или RISC-V?
Почему Вы упорно отказываетесь считать этот код универсальным для любого микропроцессора, от i4004 до AMD EPYC 9965?

А я не отказываюсь.[/uquote]

Именно, что отказываетесь, упорно применяя код на Cortex-M33, игнорируя всё остальное.
Выше, например, Вы захотели увидеть именно MCU и именно RISC-V с поддержкой векторных инструкций.
Как будто этот код нельзя использовать на одноплатниках с тем же Allwinner Xuantie-C906.
Это даже не считая того, что похожий код я сейчас использую на AMD EPIC 9374F.

Я вот подумал, попробуем начать с начала. Давайте обсудим первое мое утверждение, а потом будем двигаться дальше.
"Известными сейчас векторными расширениями систем команд, вне зависимости от архитектуры или конкретного процессора, сравнения векторизуется, а вот перестановки (swap) - нет."
Есть возражения?

Adrift

[uquote="ПростоНуб",url="/forum/viewtopic.php?p=4644662#p4644662"]На STM32 свет клином сошелся?[/uquote]
Популярные и довольно дешевые мк, почему нет? Что принципиально поменяется, если взять мк другого производителя? У ESP32 один S3 с SIMD, у Renesas - один RA8...

ПростоНуб писал(а):Ну если именно "показать", то вот например:

2 ядра, 64 бита, 1.6GHz, флеша нет, 512MB DDR, MMU - это, по вашему, микроконтроллер? Такой же SoC, как Raspberry Pi, только там Cortex-A. Но ок, по крайней мере это действительно китайский RISC-V с RVV, возможно единственный )

ПростоНуб писал(а):Именно, что отказываетесь, упорно применяя код на Cortex-M33, игнорируя всё остальное.
Выше, например, Вы захотели увидеть именно MCU и именно RISC-V с поддержкой векторных инструкций.
Как будто этот код нельзя использовать на одноплатниках с тем же Allwinner Xuantie-C906.
Это даже не считая того, что похожий код я сейчас использую на AMD EPIC 9374F.

Я упорно применяю код на все кортексы с которыми имел дело, от M0 до M33, и RISC-V, хотя тут я не фанат. Вы сами применяете, собственно началось все со слов о том, что у вас медианный фильтр работает на ESP32-C3. RV32IMC - это же вообще примитивное ядро, ни FPU, ни даже Atomic memory. Бледная тень M33, но вам нормально и производительности хватает без SIMD ) Кстати, в CMSIS-DSP все на интринсиках написано, а не оставлено на откуп компилятору, так что даже имея Helium код может совсем другой получиться.

ПростоНуб писал(а):"Известными сейчас векторными расширениями систем команд, вне зависимости от архитектуры или конкретного процессора, сравнения векторизуется, а вот перестановки (swap) - нет."

Без понятия, у меня только gcc для x86 с Compiler Explorer сгенерил компактный SIMD код для вашего варианта, похуже для моего, clang мимо, оба компилятора для ARM тоже мимо, в Visual Studio с родным компилятором никаких SIMD не видно длаже если AVX512 включить...

ПростоНуб

[uquote="Adrift",url="/forum/viewtopic.php?p=4644725#p4644725"]

ПростоНуб писал(а):"Известными сейчас векторными расширениями систем команд, вне зависимости от архитектуры или конкретного процессора, сравнения векторизуется, а вот перестановки (swap) - нет."

Без понятия[/uquote]
Вот на этом можно пока финишировать. Обсуждать выгоды векторизации с оппонентом, который даже не хочет ничего о векторизации знать, действительно бессмысленно.

safocl

[uquote="Ivanoff-iv",url="/forum/viewtopic.php?p=4644329#p4644329"]Тоже свой алгоритм нахождения медианы... точнее среднего от медиан массива (отсекается по 0, 1 или несколько крайних значений, а из остального находится среднее арифметическое), сам массив при этом не повреждается. Условие - числа в массиве менее половины емкости типа переменной, т.к. старший бит отдаётся под метку... алгоритм разрабатывался для обработки данных с АЦП - там это условие соблюдается.
Фильтр не портит массив, это позволяет, используя колцевой буфер, использовать результаты работы АЦП повторно (это значит, что результаты фильтрации можно получать с частотой опроса АЦП)
К сожалению исходный алгоритм фильтра остался на жетком диске дома... а это я из готового кода "быстрого АмперВольтВаттОмМетра для ЛБП на меге8" выкусил.

Спойлер

Код написан в кодевижене, прошу понять и простить