add locale framework
[musl] / src / thread / pthread_create.c
1 #define _GNU_SOURCE
2 #include "pthread_impl.h"
3 #include "stdio_impl.h"
4 #include "libc.h"
5 #include <sys/mman.h>
6
7 static void dummy_0()
8 {
9 }
10 weak_alias(dummy_0, __acquire_ptc);
11 weak_alias(dummy_0, __release_ptc);
12 weak_alias(dummy_0, __pthread_tsd_run_dtors);
13
14 _Noreturn void pthread_exit(void *result)
15 {
16         pthread_t self = __pthread_self();
17         sigset_t set;
18
19         self->result = result;
20
21         while (self->cancelbuf) {
22                 void (*f)(void *) = self->cancelbuf->__f;
23                 void *x = self->cancelbuf->__x;
24                 self->cancelbuf = self->cancelbuf->__next;
25                 f(x);
26         }
27
28         __pthread_tsd_run_dtors();
29
30         __lock(self->exitlock);
31
32         /* Mark this thread dead before decrementing count */
33         __lock(self->killlock);
34         self->dead = 1;
35
36         /* Block all signals before decrementing the live thread count.
37          * This is important to ensure that dynamically allocated TLS
38          * is not under-allocated/over-committed, and possibly for other
39          * reasons as well. */
40         __block_all_sigs(&set);
41
42         /* Wait to unlock the kill lock, which governs functions like
43          * pthread_kill which target a thread id, until signals have
44          * been blocked. This precludes observation of the thread id
45          * as a live thread (with application code running in it) after
46          * the thread was reported dead by ESRCH being returned. */
47         __unlock(self->killlock);
48
49         /* It's impossible to determine whether this is "the last thread"
50          * until performing the atomic decrement, since multiple threads
51          * could exit at the same time. For the last thread, revert the
52          * decrement and unblock signals to give the atexit handlers and
53          * stdio cleanup code a consistent state. */
54         if (a_fetch_add(&libc.threads_minus_1, -1)==0) {
55                 libc.threads_minus_1 = 0;
56                 __restore_sigs(&set);
57                 exit(0);
58         }
59
60         if (self->locale != &libc.global_locale) {
61                 a_dec(&libc.uselocale_cnt);
62                 if (self->locale->ctype_utf8)
63                         a_dec(&libc.bytelocale_cnt_minus_1);
64         }
65
66         if (self->detached && self->map_base) {
67                 /* Detached threads must avoid the kernel clear_child_tid
68                  * feature, since the virtual address will have been
69                  * unmapped and possibly already reused by a new mapping
70                  * at the time the kernel would perform the write. In
71                  * the case of threads that started out detached, the
72                  * initial clone flags are correct, but if the thread was
73                  * detached later (== 2), we need to clear it here. */
74                 if (self->detached == 2) __syscall(SYS_set_tid_address, 0);
75
76                 /* The following call unmaps the thread's stack mapping
77                  * and then exits without touching the stack. */
78                 __unmapself(self->map_base, self->map_size);
79         }
80
81         for (;;) __syscall(SYS_exit, 0);
82 }
83
84 void __do_cleanup_push(struct __ptcb *cb)
85 {
86         if (!libc.has_thread_pointer) return;
87         struct pthread *self = __pthread_self();
88         cb->__next = self->cancelbuf;
89         self->cancelbuf = cb;
90 }
91
92 void __do_cleanup_pop(struct __ptcb *cb)
93 {
94         if (!libc.has_thread_pointer) return;
95         __pthread_self()->cancelbuf = cb->__next;
96 }
97
98 static int start(void *p)
99 {
100         pthread_t self = p;
101         if (self->startlock[0]) {
102                 __wait(self->startlock, 0, 1, 1);
103                 if (self->startlock[0]) {
104                         self->detached = 2;
105                         pthread_exit(0);
106                 }
107                 __restore_sigs(self->sigmask);
108         }
109         if (self->unblock_cancel)
110                 __syscall(SYS_rt_sigprocmask, SIG_UNBLOCK,
111                         SIGPT_SET, 0, _NSIG/8);
112         pthread_exit(self->start(self->start_arg));
113         return 0;
114 }
115
116 #define ROUND(x) (((x)+PAGE_SIZE-1)&-PAGE_SIZE)
117
118 /* pthread_key_create.c overrides this */
119 static const size_t dummy = 0;
120 weak_alias(dummy, __pthread_tsd_size);
121 static void *const dummy_tsd[1] = { 0 };
122 weak_alias(dummy_tsd, __pthread_tsd_main);
123
124 static FILE *const dummy_file = 0;
125 weak_alias(dummy_file, __stdin_used);
126 weak_alias(dummy_file, __stdout_used);
127 weak_alias(dummy_file, __stderr_used);
128
129 static void init_file_lock(FILE *f)
130 {
131         if (f && f->lock<0) f->lock = 0;
132 }
133
134 void *__copy_tls(unsigned char *);
135
136 int pthread_create(pthread_t *restrict res, const pthread_attr_t *restrict attrp, void *(*entry)(void *), void *restrict arg)
137 {
138         int ret;
139         size_t size, guard;
140         struct pthread *self, *new;
141         unsigned char *map = 0, *stack = 0, *tsd = 0, *stack_limit;
142         unsigned flags = CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND
143                 | CLONE_THREAD | CLONE_SYSVSEM | CLONE_SETTLS
144                 | CLONE_PARENT_SETTID | CLONE_CHILD_CLEARTID | CLONE_DETACHED;
145         int do_sched = 0;
146         pthread_attr_t attr = {0};
147
148         if (!libc.can_do_threads) return ENOSYS;
149         self = __pthread_self();
150         if (!libc.threaded) {
151                 for (FILE *f=libc.ofl_head; f; f=f->next)
152                         init_file_lock(f);
153                 init_file_lock(__stdin_used);
154                 init_file_lock(__stdout_used);
155                 init_file_lock(__stderr_used);
156                 __syscall(SYS_rt_sigprocmask, SIG_UNBLOCK, SIGPT_SET, 0, _NSIG/8);
157                 self->tsd = (void **)__pthread_tsd_main;
158                 libc.threaded = 1;
159         }
160         if (attrp) attr = *attrp;
161
162         __acquire_ptc();
163
164         if (attr._a_stackaddr) {
165                 size_t need = libc.tls_size + __pthread_tsd_size;
166                 size = attr._a_stacksize + DEFAULT_STACK_SIZE;
167                 stack = (void *)(attr._a_stackaddr & -16);
168                 stack_limit = (void *)(attr._a_stackaddr - size);
169                 /* Use application-provided stack for TLS only when
170                  * it does not take more than ~12% or 2k of the
171                  * application's stack space. */
172                 if (need < size/8 && need < 2048) {
173                         tsd = stack - __pthread_tsd_size;
174                         stack = tsd - libc.tls_size;
175                 } else {
176                         size = ROUND(need);
177                         guard = 0;
178                 }
179         } else {
180                 guard = ROUND(DEFAULT_GUARD_SIZE + attr._a_guardsize);
181                 size = guard + ROUND(DEFAULT_STACK_SIZE + attr._a_stacksize
182                         + libc.tls_size +  __pthread_tsd_size);
183         }
184
185         if (!tsd) {
186                 if (guard) {
187                         map = mmap(0, size, PROT_NONE, MAP_PRIVATE|MAP_ANON, -1, 0);
188                         if (map == MAP_FAILED) goto fail;
189                         if (mprotect(map+guard, size-guard, PROT_READ|PROT_WRITE)) {
190                                 munmap(map, size);
191                                 goto fail;
192                         }
193                 } else {
194                         map = mmap(0, size, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANON, -1, 0);
195                         if (map == MAP_FAILED) goto fail;
196                 }
197                 tsd = map + size - __pthread_tsd_size;
198                 if (!stack) {
199                         stack = tsd - libc.tls_size;
200                         stack_limit = map + guard;
201                 }
202         }
203
204         new = __copy_tls(tsd - libc.tls_size);
205         new->map_base = map;
206         new->map_size = size;
207         new->stack = stack;
208         new->stack_size = stack - stack_limit;
209         new->pid = self->pid;
210         new->start = entry;
211         new->start_arg = arg;
212         new->self = new;
213         new->tsd = (void *)tsd;
214         new->locale = &libc.global_locale;
215         if (attr._a_detach) {
216                 new->detached = 1;
217                 flags -= CLONE_CHILD_CLEARTID;
218         }
219         if (attr._a_sched) {
220                 do_sched = new->startlock[0] = 1;
221                 __block_app_sigs(new->sigmask);
222         }
223         new->unblock_cancel = self->cancel;
224         new->canary = self->canary;
225
226         a_inc(&libc.threads_minus_1);
227         ret = __clone(start, stack, flags, new, &new->tid, TP_ADJ(new), &new->tid);
228
229         __release_ptc();
230
231         if (do_sched) {
232                 __restore_sigs(new->sigmask);
233         }
234
235         if (ret < 0) {
236                 a_dec(&libc.threads_minus_1);
237                 if (map) munmap(map, size);
238                 return EAGAIN;
239         }
240
241         if (do_sched) {
242                 ret = __syscall(SYS_sched_setscheduler, new->tid,
243                         attr._a_policy, &attr._a_prio);
244                 a_store(new->startlock, ret<0 ? 2 : 0);
245                 __wake(new->startlock, 1, 1);
246                 if (ret < 0) return -ret;
247         }
248
249         *res = new;
250         return 0;
251 fail:
252         __release_ptc();
253         return EAGAIN;
254 }