1
/
5

画像解析を高速化させるためのTips【記事まとめ】

Photo by Joan Gamell on Unsplash

こんにちは!アダコテックでは、日々開発ブログや社員による記事をnoteで発信しています。


この記事では、エンジニアの伊部による、画像解析に関するTipsの記事をまとめました!


画像解析を高速化させるためのTipsわかりやすくまとめてみた(1)|伊部 卓秀 (アダコテック)|note
こんにちは、こんばんは、はじめまして。 株式会社アダコテック の伊部です。弊社では、製造業に向けた異常検知のAIソフトウェアを開発・提供しています。私はそこで、画像処理・機械学習のソフトウェアを開発するエンジニアをしています。 画像解析で検査を自動化する上で、画像認識の処理速度がミリセックオーダーで検査を実行するのが必須で、高速に画像処理・学習・解析をおこなうため、アダコテックでは長年にかけてそこのチューニングをしてきたので、そこらへんのエッセンスをお伝えしようと思います。 想定読者:画像処理を勉強されて
https://note.com/t_ibe/n/ndac471af8cb0
画像解析を高速化させるためのTipsわかりやすくまとめてみた(2)|伊部 卓秀 (アダコテック)|note
前回は、整数型での四捨五入の話をしました。整数型のみで計算をすれば浮動小数点型を使うよりも(ちょっとだけ)速く計算できますよという話でした。 前回の整数型演算の話の延長で、今回は、固定小数点数の話をします。(SIMDの話は、次回以降にします。) ...
https://note.com/t_ibe/n/n3ed1ae9fe299
画像解析を高速化させるためのTipsわかりやすくまとめてみた(3)|伊部 卓秀 (アダコテック)|note
前回(第2回) は、固定小数点数の話をしました。固定小数点数を使った整数型演算で、割り算を使わない割り算の方法を説明しました。 今回は、前回説明した、割り算を使わない割り算を用いて、 前々回(第1回) の整数型での四捨五入を、SIMDの整数型で計算する方法を説明します。 Single Instruction, Multiple Data ...
https://note.com/t_ibe/n/n32e5bec44523
画像解析を高速化させるためのTipsわかりやすくまとめてみた(4)|伊部 卓秀 (アダコテック)|note
前回(第3回)は、整数型での四捨五入を、SSE2~SSE4.1の整数型で計算する方法を説明しました。 今回は、AVX2の整数型で計算してみます。レジスタ長が2倍になるから2倍速くなってくれるよね...? 割り算を使わない割り算のAVX2での実装 前回のコードとの違いは、変数の型が m128_t から m256_t に、 関数のプレフィックスが _mm128 から _mm256 になっているところです。また、アラインメントは、SSEの場合は16バイトに合わせましたが、AVXの場合は32バイトに合わせる必要が
https://note.com/t_ibe/n/n16ab4e301dc7
画像解析を高速化させるためのTipsわかりやすくまとめてみた(5)|伊部 卓秀 (アダコテック)|note
前回(第4回)は、整数型での四捨五入を、AVX2の整数型で実装しました。 今回は、もっと単純なお題で、SSE2とAVX2の比較をしてみたいと思います。 乱数の入った80000000個の符号なし8bit整数型の配列を2つ(X, Y)を用意し、XとYの要素同士の平均値Zを求めます(ただし、小数点以下は切り上げ)。つまり、Z[i] = ceil(X[i] + Y[i]) です。 前回までは、32bit整数型でしたが、今回は8bit整数型です。SSE2の場合はレジスタが128bitなので16個、AVX2の場合はレ
https://note.com/t_ibe/n/nc29cedf585e5
画像解析を高速化させるためのTipsわかりやすくまとめてみた(6) プリフェッチ|伊部 卓秀 (アダコテック)|note
前回(第5回) は、SSE2とAVX2の比較をしました。ベンチマークの結果、同じメモリに対して繰り返すだけなら約1.8倍高速化出来ましたが、大きな配列に対して連続して計算すると、約1.03倍にしかなりませんでした。 ...
https://note.com/t_ibe/n/ncb89fbb7a09c


アダコテックではエンジニアをはじめ、メンバーを募集中です。

気になった方はぜひ募集記事もご覧ください!

株式会社アダコテック's job postings

Weekly ranking

Show other rankings