日記

フリーページ

2018年10月28日
XML
カテゴリ:Linux
4年前にコードを紹介した可変Δtのオフラインパターン生成ですが、
そのまま移植して、速度を計ったら、1回 16μsec(最適化あり)だった。

いや、先日まで、パターン生成の計算部分の高速化にneon(armのベクトル計算機能)が使えたらな~、とか馬鹿なことを考えていたのですが、
よくよくコードを見ると、1段毎に前の計算結果を除算するなど、とてもベクトル計算機能が使えるものではなかったです・・・。

現状、手持ちのコマで、プロトタイプのソースコードを移植したら、
AP-RZG-0A(Linuxボード)の性能で、全然問題なく、やりたいことができちゃうな~。

でも、それだけだとツマンナイかも。(^^;;;

今回、​neon​について​ちょこっと​調べたけど、組み込み関数つかって、​かなり簡単(?)​に使えそう・・・。

ちなみにインクルードファイルは、ここにあった。
./aprzg0a/build/tmp/sysroots/x86_64-linux/usr/lib/cortexa7hf-vfp-neon-poky-linux-gnueabi/gcc/arm-poky-linux-gnueabi/4.8.3/include/arm_neon.h

なので、順運動学のneon化に再チャレンジしようかなぁ~!?






最終更新日  2018年10月28日 22時03分51秒

PR

キーワードサーチ

▼キーワード検索

プロフィール


nisiken2002

お気に入りブログ

まだ登録されていません

Copyright (c) 1997-2018 Rakuten, Inc. All Rights Reserved.