drop lazy plural forms init in dcngettext
[musl] / src / locale / dcngettext.c
1 #include <libintl.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <errno.h>
5 #include <limits.h>
6 #include <sys/stat.h>
7 #include <sys/mman.h>
8 #include <ctype.h>
9 #include "locale_impl.h"
10 #include "atomic.h"
11 #include "pleval.h"
12 #include "lock.h"
13
14 struct binding {
15         struct binding *next;
16         int dirlen;
17         volatile int active;
18         char *domainname;
19         char *dirname;
20         char buf[];
21 };
22
23 static void *volatile bindings;
24
25 static char *gettextdir(const char *domainname, size_t *dirlen)
26 {
27         struct binding *p;
28         for (p=bindings; p; p=p->next) {
29                 if (!strcmp(p->domainname, domainname) && p->active) {
30                         *dirlen = p->dirlen;
31                         return (char *)p->dirname;
32                 }
33         }
34         return 0;
35 }
36
37 char *bindtextdomain(const char *domainname, const char *dirname)
38 {
39         static volatile int lock[1];
40         struct binding *p, *q;
41
42         if (!domainname) return 0;
43         if (!dirname) return gettextdir(domainname, &(size_t){0});
44
45         size_t domlen = strnlen(domainname, NAME_MAX+1);
46         size_t dirlen = strnlen(dirname, PATH_MAX);
47         if (domlen > NAME_MAX || dirlen >= PATH_MAX) {
48                 errno = EINVAL;
49                 return 0;
50         }
51
52         LOCK(lock);
53
54         for (p=bindings; p; p=p->next) {
55                 if (!strcmp(p->domainname, domainname) &&
56                     !strcmp(p->dirname, dirname)) {
57                         break;
58                 }
59         }
60
61         if (!p) {
62                 p = calloc(sizeof *p + domlen + dirlen + 2, 1);
63                 if (!p) {
64                         UNLOCK(lock);
65                         return 0;
66                 }
67                 p->next = bindings;
68                 p->dirlen = dirlen;
69                 p->domainname = p->buf;
70                 p->dirname = p->buf + domlen + 1;
71                 memcpy(p->domainname, domainname, domlen+1);
72                 memcpy(p->dirname, dirname, dirlen+1);
73                 a_cas_p(&bindings, bindings, p);
74         }
75
76         a_store(&p->active, 1);
77
78         for (q=bindings; q; q=q->next) {
79                 if (!strcmp(q->domainname, domainname) && q != p)
80                         a_store(&q->active, 0);
81         }
82
83         UNLOCK(lock);
84         
85         return (char *)p->dirname;
86 }
87
88 static const char catnames[][12] = {
89         "LC_CTYPE",
90         "LC_NUMERIC",
91         "LC_TIME",
92         "LC_COLLATE",
93         "LC_MONETARY",
94         "LC_MESSAGES",
95 };
96
97 static const char catlens[] = { 8, 10, 7, 10, 11, 11 };
98
99 struct msgcat {
100         struct msgcat *next;
101         const void *map;
102         size_t map_size;
103         const char *plural_rule;
104         int nplurals;
105         struct binding *binding;
106         const struct __locale_map *lm;
107         int cat;
108 };
109
110 static char *dummy_gettextdomain()
111 {
112         return "messages";
113 }
114
115 weak_alias(dummy_gettextdomain, __gettextdomain);
116
117 char *dcngettext(const char *domainname, const char *msgid1, const char *msgid2, unsigned long int n, int category)
118 {
119         static struct msgcat *volatile cats;
120         struct msgcat *p;
121         struct __locale_struct *loc = CURRENT_LOCALE;
122         const struct __locale_map *lm;
123         size_t domlen;
124         struct binding *q;
125
126         if ((unsigned)category >= LC_ALL) goto notrans;
127
128         if (!domainname) domainname = __gettextdomain();
129
130         domlen = strnlen(domainname, NAME_MAX+1);
131         if (domlen > NAME_MAX) goto notrans;
132
133         for (q=bindings; q; q=q->next)
134                 if (!strcmp(q->domainname, domainname) && q->active)
135                         break;
136         if (!q) goto notrans;
137
138         lm = loc->cat[category];
139         if (!lm) {
140 notrans:
141                 return (char *) ((n == 1) ? msgid1 : msgid2);
142         }
143
144         for (p=cats; p; p=p->next)
145                 if (p->binding == q && p->lm == lm && p->cat == category)
146                         break;
147
148         if (!p) {
149                 const char *dirname, *locname, *catname, *modname, *locp;
150                 size_t dirlen, loclen, catlen, modlen, alt_modlen;
151                 void *old_cats;
152                 size_t map_size;
153
154                 dirname = q->dirname;
155                 locname = lm->name;
156                 catname = catnames[category];
157
158                 dirlen = q->dirlen;
159                 loclen = strlen(locname);
160                 catlen = catlens[category];
161
162                 /* Logically split @mod suffix from locale name. */
163                 modname = memchr(locname, '@', loclen);
164                 if (!modname) modname = locname + loclen;
165                 alt_modlen = modlen = loclen - (modname-locname);
166                 loclen = modname-locname;
167
168                 /* Drop .charset identifier; it is not used. */
169                 const char *csp = memchr(locname, '.', loclen);
170                 if (csp) loclen = csp-locname;
171
172                 char name[dirlen+1 + loclen+modlen+1 + catlen+1 + domlen+3 + 1];
173                 const void *map;
174
175                 for (;;) {
176                         snprintf(name, sizeof name, "%s/%.*s%.*s/%s/%s.mo\0",
177                                 dirname, (int)loclen, locname,
178                                 (int)alt_modlen, modname, catname, domainname);
179                         if (map = __map_file(name, &map_size)) break;
180
181                         /* Try dropping @mod, _YY, then both. */
182                         if (alt_modlen) {
183                                 alt_modlen = 0;
184                         } else if ((locp = memchr(locname, '_', loclen))) {
185                                 loclen = locp-locname;
186                                 alt_modlen = modlen;
187                         } else {
188                                 break;
189                         }
190                 }
191                 if (!map) goto notrans;
192
193                 p = calloc(sizeof *p, 1);
194                 if (!p) {
195                         __munmap((void *)map, map_size);
196                         goto notrans;
197                 }
198                 p->cat = category;
199                 p->binding = q;
200                 p->lm = lm;
201                 p->map = map;
202                 p->map_size = map_size;
203
204                 const char *rule = "n!=1;";
205                 unsigned long np = 2;
206                 const char *r = __mo_lookup(p->map, p->map_size, "");
207                 char *z;
208                 while (r && strncmp(r, "Plural-Forms:", 13)) {
209                         z = strchr(r, '\n');
210                         r = z ? z+1 : 0;
211                 }
212                 if (r) {
213                         r += 13;
214                         while (isspace(*r)) r++;
215                         if (!strncmp(r, "nplurals=", 9)) {
216                                 np = strtoul(r+9, &z, 10);
217                                 r = z;
218                         }
219                         while (*r && *r != ';') r++;
220                         if (*r) {
221                                 r++;
222                                 while (isspace(*r)) r++;
223                                 if (!strncmp(r, "plural=", 7))
224                                         rule = r+7;
225                         }
226                 }
227                 p->nplurals = np;
228                 p->plural_rule = rule;
229
230                 do {
231                         old_cats = cats;
232                         p->next = old_cats;
233                 } while (a_cas_p(&cats, old_cats, p) != old_cats);
234         }
235
236         const char *trans = __mo_lookup(p->map, p->map_size, msgid1);
237         if (!trans) goto notrans;
238
239         /* Non-plural-processing gettext forms pass a null pointer as
240          * msgid2 to request that dcngettext suppress plural processing. */
241
242         if (msgid2 && p->nplurals) {
243                 unsigned long plural = __pleval(p->plural_rule, n);
244                 if (plural > p->nplurals) goto notrans;
245                 while (plural--) {
246                         size_t rem = p->map_size - (trans - (char *)p->map);
247                         size_t l = strnlen(trans, rem);
248                         if (l+1 >= rem)
249                                 goto notrans;
250                         trans += l+1;
251                 }
252         }
253         return (char *)trans;
254 }
255
256 char *dcgettext(const char *domainname, const char *msgid, int category)
257 {
258         return dcngettext(domainname, msgid, 0, 1, category);
259 }
260
261 char *dngettext(const char *domainname, const char *msgid1, const char *msgid2, unsigned long int n)
262 {
263         return dcngettext(domainname, msgid1, msgid2, n, LC_MESSAGES);
264 }
265
266 char *dgettext(const char *domainname, const char *msgid)
267 {
268         return dcngettext(domainname, msgid, 0, 1, LC_MESSAGES);
269 }