replace all remaining internal uses of pthread_self with __pthread_self
[musl] / src / thread / pthread_create.c
1 #define _GNU_SOURCE
2 #include "pthread_impl.h"
3 #include "stdio_impl.h"
4 #include "libc.h"
5 #include <sys/mman.h>
6
7 static void dummy_0()
8 {
9 }
10 weak_alias(dummy_0, __acquire_ptc);
11 weak_alias(dummy_0, __release_ptc);
12 weak_alias(dummy_0, __pthread_tsd_run_dtors);
13
14 _Noreturn void pthread_exit(void *result)
15 {
16         pthread_t self = __pthread_self();
17         sigset_t set;
18
19         self->result = result;
20
21         while (self->cancelbuf) {
22                 void (*f)(void *) = self->cancelbuf->__f;
23                 void *x = self->cancelbuf->__x;
24                 self->cancelbuf = self->cancelbuf->__next;
25                 f(x);
26         }
27
28         __pthread_tsd_run_dtors();
29
30         __lock(self->exitlock);
31
32         /* Mark this thread dead before decrementing count */
33         __lock(self->killlock);
34         self->dead = 1;
35
36         /* Block all signals before decrementing the live thread count.
37          * This is important to ensure that dynamically allocated TLS
38          * is not under-allocated/over-committed, and possibly for other
39          * reasons as well. */
40         __block_all_sigs(&set);
41
42         /* Wait to unlock the kill lock, which governs functions like
43          * pthread_kill which target a thread id, until signals have
44          * been blocked. This precludes observation of the thread id
45          * as a live thread (with application code running in it) after
46          * the thread was reported dead by ESRCH being returned. */
47         __unlock(self->killlock);
48
49         /* It's impossible to determine whether this is "the last thread"
50          * until performing the atomic decrement, since multiple threads
51          * could exit at the same time. For the last thread, revert the
52          * decrement and unblock signals to give the atexit handlers and
53          * stdio cleanup code a consistent state. */
54         if (a_fetch_add(&libc.threads_minus_1, -1)==0) {
55                 libc.threads_minus_1 = 0;
56                 __restore_sigs(&set);
57                 exit(0);
58         }
59
60         if (self->detached && self->map_base) {
61                 /* Detached threads must avoid the kernel clear_child_tid
62                  * feature, since the virtual address will have been
63                  * unmapped and possibly already reused by a new mapping
64                  * at the time the kernel would perform the write. In
65                  * the case of threads that started out detached, the
66                  * initial clone flags are correct, but if the thread was
67                  * detached later (== 2), we need to clear it here. */
68                 if (self->detached == 2) __syscall(SYS_set_tid_address, 0);
69
70                 /* The following call unmaps the thread's stack mapping
71                  * and then exits without touching the stack. */
72                 __unmapself(self->map_base, self->map_size);
73         }
74
75         for (;;) __syscall(SYS_exit, 0);
76 }
77
78 void __do_cleanup_push(struct __ptcb *cb)
79 {
80         if (!libc.has_thread_pointer) return;
81         struct pthread *self = __pthread_self();
82         cb->__next = self->cancelbuf;
83         self->cancelbuf = cb;
84 }
85
86 void __do_cleanup_pop(struct __ptcb *cb)
87 {
88         if (!libc.has_thread_pointer) return;
89         __pthread_self()->cancelbuf = cb->__next;
90 }
91
92 static int start(void *p)
93 {
94         pthread_t self = p;
95         if (self->startlock[0]) {
96                 __wait(self->startlock, 0, 1, 1);
97                 if (self->startlock[0]) {
98                         self->detached = 2;
99                         pthread_exit(0);
100                 }
101                 __restore_sigs(self->sigmask);
102         }
103         if (self->unblock_cancel)
104                 __syscall(SYS_rt_sigprocmask, SIG_UNBLOCK,
105                         SIGPT_SET, 0, _NSIG/8);
106         pthread_exit(self->start(self->start_arg));
107         return 0;
108 }
109
110 #define ROUND(x) (((x)+PAGE_SIZE-1)&-PAGE_SIZE)
111
112 /* pthread_key_create.c overrides this */
113 static const size_t dummy = 0;
114 weak_alias(dummy, __pthread_tsd_size);
115 static void *const dummy_tsd[1] = { 0 };
116 weak_alias(dummy_tsd, __pthread_tsd_main);
117
118 static FILE *const dummy_file = 0;
119 weak_alias(dummy_file, __stdin_used);
120 weak_alias(dummy_file, __stdout_used);
121 weak_alias(dummy_file, __stderr_used);
122
123 static void init_file_lock(FILE *f)
124 {
125         if (f && f->lock<0) f->lock = 0;
126 }
127
128 void *__copy_tls(unsigned char *);
129
130 int pthread_create(pthread_t *restrict res, const pthread_attr_t *restrict attrp, void *(*entry)(void *), void *restrict arg)
131 {
132         int ret;
133         size_t size, guard;
134         struct pthread *self, *new;
135         unsigned char *map = 0, *stack = 0, *tsd = 0, *stack_limit;
136         unsigned flags = CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND
137                 | CLONE_THREAD | CLONE_SYSVSEM | CLONE_SETTLS
138                 | CLONE_PARENT_SETTID | CLONE_CHILD_CLEARTID | CLONE_DETACHED;
139         int do_sched = 0;
140         pthread_attr_t attr = {0};
141
142         if (!libc.can_do_threads) return ENOSYS;
143         self = __pthread_self();
144         if (!libc.threaded) {
145                 for (FILE *f=libc.ofl_head; f; f=f->next)
146                         init_file_lock(f);
147                 init_file_lock(__stdin_used);
148                 init_file_lock(__stdout_used);
149                 init_file_lock(__stderr_used);
150                 __syscall(SYS_rt_sigprocmask, SIG_UNBLOCK, SIGPT_SET, 0, _NSIG/8);
151                 self->tsd = (void **)__pthread_tsd_main;
152                 libc.threaded = 1;
153         }
154         if (attrp) attr = *attrp;
155
156         __acquire_ptc();
157
158         if (attr._a_stackaddr) {
159                 size_t need = libc.tls_size + __pthread_tsd_size;
160                 size = attr._a_stacksize + DEFAULT_STACK_SIZE;
161                 stack = (void *)(attr._a_stackaddr & -16);
162                 stack_limit = (void *)(attr._a_stackaddr - size);
163                 /* Use application-provided stack for TLS only when
164                  * it does not take more than ~12% or 2k of the
165                  * application's stack space. */
166                 if (need < size/8 && need < 2048) {
167                         tsd = stack - __pthread_tsd_size;
168                         stack = tsd - libc.tls_size;
169                 } else {
170                         size = ROUND(need);
171                         guard = 0;
172                 }
173         } else {
174                 guard = ROUND(DEFAULT_GUARD_SIZE + attr._a_guardsize);
175                 size = guard + ROUND(DEFAULT_STACK_SIZE + attr._a_stacksize
176                         + libc.tls_size +  __pthread_tsd_size);
177         }
178
179         if (!tsd) {
180                 if (guard) {
181                         map = mmap(0, size, PROT_NONE, MAP_PRIVATE|MAP_ANON, -1, 0);
182                         if (map == MAP_FAILED) goto fail;
183                         if (mprotect(map+guard, size-guard, PROT_READ|PROT_WRITE)) {
184                                 munmap(map, size);
185                                 goto fail;
186                         }
187                 } else {
188                         map = mmap(0, size, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANON, -1, 0);
189                         if (map == MAP_FAILED) goto fail;
190                 }
191                 tsd = map + size - __pthread_tsd_size;
192                 if (!stack) {
193                         stack = tsd - libc.tls_size;
194                         stack_limit = map + guard;
195                 }
196         }
197
198         new = __copy_tls(tsd - libc.tls_size);
199         new->map_base = map;
200         new->map_size = size;
201         new->stack = stack;
202         new->stack_size = stack - stack_limit;
203         new->pid = self->pid;
204         new->errno_ptr = &new->errno_val;
205         new->start = entry;
206         new->start_arg = arg;
207         new->self = new;
208         new->tsd = (void *)tsd;
209         if (attr._a_detach) {
210                 new->detached = 1;
211                 flags -= CLONE_CHILD_CLEARTID;
212         }
213         if (attr._a_sched) {
214                 do_sched = new->startlock[0] = 1;
215                 __block_app_sigs(new->sigmask);
216         }
217         new->unblock_cancel = self->cancel;
218         new->canary = self->canary;
219
220         a_inc(&libc.threads_minus_1);
221         ret = __clone(start, stack, flags, new, &new->tid, TP_ADJ(new), &new->tid);
222
223         __release_ptc();
224
225         if (do_sched) {
226                 __restore_sigs(new->sigmask);
227         }
228
229         if (ret < 0) {
230                 a_dec(&libc.threads_minus_1);
231                 if (map) munmap(map, size);
232                 return EAGAIN;
233         }
234
235         if (do_sched) {
236                 ret = __syscall(SYS_sched_setscheduler, new->tid,
237                         attr._a_policy, &attr._a_prio);
238                 a_store(new->startlock, ret<0 ? 2 : 0);
239                 __wake(new->startlock, 1, 1);
240                 if (ret < 0) return -ret;
241         }
242
243         *res = new;
244         return 0;
245 fail:
246         __release_ptc();
247         return EAGAIN;
248 }