コグノスケ

link

未来から過去へ表示(*) link

link

過去から未来へ表示

link

2019年12月30日 >>> 2019年12月17日

link

2019年12月17日

link

link

memsetのベンチマーク（AArch64, Cortex-A72編）

目次: ベンチマーク

（参考）コード一式はGitHubに置きました（GitHubへのリンク）

先日Ryzen 7 2700なx86_64マシンでmemsetの性能を計測（2019年12月14日の日記参照）しました。同様の計測をAArch64でもやってみました。環境はRK3399 Cotex-A72 1.8GHzです。メモリはおそらくLPDDR3-1600のはず、OSはDebian GNU/Linux 10.2 busterです。

リファレンスとするのは前回同様、システムにインストールされているglibc-2.28のmemset関数（アセンブラ版）です。大抵の場合、この関数が最速ですね。

ざっとglibc-2.28の実装を見たところ、x86_64向けは各種SIMD向けに最適化されたアセンブラコード（glibc/sysdeps/x86_64/multiarch/memset-avx2-unaligned-erms.Sなど）が使われて、aarch64向けは汎用的なアセンブラコード（glibc/sysdeps/aarch64/memset.S）が使われるようです。

まずは最適化オプションO3とO2の差から見てみようと思います。

gcc -O3 -fno-builtinの測定結果（Cortex-A72編）

gcc -O2 -fno-builtinの測定結果（Cortex-A72編）

やはりO3の最適化による速度向上はさすがとしか言えません。x86_64ではあまり振るわなかったmusl memset関数が非常に優秀で、libcのmemsetに並ぶ勢いです。

AArch64のNEONを使ったベクトル最適化

前回はベクトル最適化 -ftree-vectorizeオプションを使うとほぼO3の性能に追い付きましたが、AArch64ではどうなるでしょう？

gcc -O2 -ftree-vectorize -fno-builtinの測定結果（Cortex-A72編）

ベクトル最適化を有効にするとNEONの128bitストア命令が使われるようになります。

O2と比較すると確かに性能向上していますが、x86_64ほどの威力は発揮しません。

メモ: 技術系の話はFacebookから転記しておくことにした。大幅に加筆。

編集者:すずき(2023/09/24 08:54)

コメント一覧

コメントはありません。

この記事にコメントする

link

2019年12月30日 >>> 2019年12月17日

link

管理用メニュー

link

記事を新規作成

link

<	2019					>
<<	<	12			>	>>
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31	-	-	-	-

link

本日の日記へ

最近のコメント20件

14年6月13日
2048player...さん (09/26 01:04)
「最後に、この式を出すのに紙4枚(A4)も...」
14年6月13日
2048playerさん (09/26 01:00)
「今のところ最も簡略化した式です。\n--...」
14年6月13日
2048playerさん (09/16 01:00)
「返信ありがとうございます。\nコメントが...」
14年6月13日
すずきさん (09/12 21:19)
「コメントありがとうございます。同じ結果に...」
14年6月13日
2048playerさん (09/08 17:30)
「私も2048の最高スコアを求めたのですが...」
14年6月13日
2048さん (09/08 17:16)
「私も2048の最高スコアを求めたのですが...」
14年6月13日
2048playerさん (09/08 16:10)
「私も2048の最高スコアを求めたのですが...」
02年8月4日
lxbfYeaaさん (07/12 10:11)
「555」
24年6月17日
すずきさん (06/23 00:12)
「ありがとうございます。バルコニーではない...」
24年6月17日
hdkさん (06/22 22:08)
「GPSの最初の同期を取る時は見晴らしのい...」
24年5月16日
すずきさん (05/21 11:41)
「あー、確かにdpkg-reconfigu...」
24年5月16日
hdkさん (05/21 08:55)
「システム全体のlocale設定はDebi...」
24年5月17日
すずきさん (05/20 13:16)
「そうですねえ、普通はStandardなの...」
24年5月17日
hdkさん (05/19 07:45)
「なるほど、そういうことなんですね。Exc...」
24年5月17日
すずきさん (05/19 03:41)
「Standardだと下記の設定になってい...」
24年5月17日
hdkさん (05/18 22:16)
「ドメインを変えたせいで別サイト扱いになっ...」
24年4月22日
hdkさん (04/24 08:36)
「うちのHHFZ4310は15年突破しまし...」
24年4月22日
すずきさん (04/24 00:37)
「ちゃんと数えてないですけど蛍光管が10年...」
24年4月22日
hdkさん (04/23 20:52)
「おお... うちのHHFZ4310より後...」
20年6月19日
すずきさん (04/06 22:54)
「ディレクトリを予め作成しておけば良いです...」

link

もっとみる

最近の記事3件

24年9月14日
すずき (09/22 11:23)
「[OpenSBIを調べる - scratch領域の詳細] 目次: Linux今回はOpenSBIのコード内に頻出するscrat...」
21年8月11日
すずき (09/22 00:15)
「[Kindle - まとめリンク] 目次: Kindle初代Kindle Fire HDの話。Kindle Fire HDのカ...」
24年8月11日
すずき (09/22 00:14)
「[Amazonマイリストへの問い合わせの返事がきた] 目次: Kindle先日（2024年8月4日の日記参照）Amazonへ問...」

link

もっとみる

こんてんつ

wiki

link

Linux JM

link

Java API

link

link

link

link

Java 2 SE 5.0
link

link

Java 2 SE 1.4.0
link

link

Java 2 SE 1.3
link

link

Java Media Framework 2.0

過去の日記

2002年

8月 9月
10月 11月 12月

2003年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2004年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2005年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2006年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2007年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2008年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2009年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2010年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2011年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2012年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2013年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2014年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2015年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2016年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2017年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2018年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2019年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2020年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2021年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2022年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2023年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月 11月 12月

2024年

1月 2月 3月
4月 5月 6月
7月 8月 9月
10月

過去日記について

link

その他の情報

アクセス統計

link

エージェントごと

link

ホストごと

link

サーバ一覧

link

マスタ(SAKURA)
link

link

ミラー(自宅)

サイトの情報

check passed

HTML 4.01 Strict
check passed

check passed

合計: counter total
本日: counter today

link About www2.katsuster.net
RDFファイル RSS 1.0

最終更新: 09/26 01:04

管理者: Katsuhiro Suzuki(katsuhiro( a t )katsuster.net)

This is Simple Diary 1.0 Copyright(C) Katsuhiro Suzuki 2006-2023.
Powered by PHP 8.2.20. using GD 2.3.3(png support.)