overhaul ARM atomics/tls for performance and compatibility
[musl] / arch / arm / src / __set_thread_area.c
1 #include <stdint.h>
2 #include <elf.h>
3 #include "pthread_impl.h"
4 #include "libc.h"
5
6 #define HWCAP_TLS (1 << 15)
7
8 extern const unsigned char __attribute__((__visibility__("hidden")))
9         __a_barrier_dummy[], __a_barrier_oldkuser[],
10         __a_barrier_v6[], __a_barrier_v7[],
11         __a_cas_dummy[], __a_cas_v6[], __a_cas_v7[],
12         __a_gettp_dummy[], __a_gettp_native[];
13
14 #define __a_barrier_kuser 0xffff0fa0
15 #define __a_cas_kuser 0xffff0fc0
16 #define __a_gettp_kuser 0xffff0fe0
17
18 extern uintptr_t __attribute__((__visibility__("hidden")))
19         __a_barrier_ptr, __a_cas_ptr, __a_gettp_ptr;
20
21 #define SET(op,ver) (__a_##op##_ptr = \
22         (uintptr_t)__a_##op##_##ver - (uintptr_t)__a_##op##_dummy)
23
24 int __set_thread_area(void *p)
25 {
26 #if !__ARM_ARCH_7A__ && !__ARM_ARCH_7R__ && __ARM_ARCH < 7
27         if (__hwcap & HWCAP_TLS) {
28                 size_t *aux;
29                 SET(gettp, native);
30                 SET(cas, v7);
31                 SET(barrier, v7);
32                 for (aux=libc.auxv; *aux; aux+=2) {
33                         if (*aux != AT_PLATFORM) continue;
34                         const char *s = (void *)aux[1];
35                         if (s[0]!='v' || s[1]!='6' || s[2]-'0'<10u) break;
36                         SET(cas, v6);
37                         SET(barrier, v6);
38                         break;
39                 }
40         } else {
41                 int ver = *(int *)0xffff0ffc;
42                 SET(gettp, kuser);
43                 SET(cas, kuser);
44                 SET(barrier, kuser);
45                 if (ver < 2) a_crash();
46                 if (ver < 3) SET(barrier, oldkuser);
47         }
48 #endif
49         return __syscall(0xf0005, p);
50 }