add arm-optimized memcpy implementation from bionic libc
authorRich Felker <dalias@aerifal.cx>
Wed, 14 Aug 2013 07:06:21 +0000 (03:06 -0400)
committerRich Felker <dalias@aerifal.cx>
Wed, 14 Aug 2013 07:06:21 +0000 (03:06 -0400)
commitcccc1844be95549e5b6c91ffc1f2c2ba3d3aab16
treebf9cd7643d50131983f17d4631432b70db274d9c
parentfb72a97df9222be61ec582ba7b1e9ce496b65e3e
add arm-optimized memcpy implementation from bionic libc

the approach of this implementation was heavily investigated prior to
adopting it. attempts to obtain similar performance with pure C code
were capping out at about 75% of the performance of the asm, with
considerably larger code size, and were fragile in that the compiler
would sometimes compile part of memcpy into a call to itself.
therefore, just using the asm seems to be the best option.

this commit is the first to make use of the new subarch-specific asm
framework. the new armel directory is the location for arm asm that
should not be used for all arm subarchs, only the default one. armhf
is the name of the little-endian hardfloat-ABI subarch, which can use
the exact same asm. in both cases, the build system finds the asm by
following a memcpy.sub file.

the other two subarchs, armeb and armebhf, would need a big-endian
variant of this code. it would not be hard to adapt the code to big
endian, but I will hold off on doing so until there is demand for it.
COPYRIGHT
src/string/armel/memcpy.s [new file with mode: 0644]
src/string/armel/memcpy.sub [new file with mode: 0644]
src/string/armhf/memcpy.sub [new file with mode: 0644]