new floating point parser/converter
[musl] / src / internal / floatscan.c
1 #include <stdint.h>
2 #include <stdio.h>
3 #include <math.h>
4 #include <float.h>
5 #include <limits.h>
6
7 #include "floatscan.h"
8
9 #if LDBL_MANT_DIG == 53 && LDBL_MAX_EXP == 1024
10
11 #define LD_B1B_DIG 2
12 #define LD_B1B_MAX 9007199, 254740991
13 #define KMAX 128
14
15 #else /* LDBL_MANT_DIG == 64 && LDBL_MAX_EXP == 16384 */
16
17 #define LD_B1B_DIG 3
18 #define LD_B1B_MAX 18, 446744073, 709551615
19 #define KMAX 2048
20
21 #endif
22
23 #define MASK (KMAX-1)
24
25
26 #if 1
27 #include "stdio_impl.h"
28 #undef ungetc
29 #define ungetc(c,f) ((f)->rpos--,(c))
30 #undef getc
31 #define getc getc_unlocked
32 #endif
33
34
35 static long long scanexp(FILE *f, off_t *pcnt)
36 {
37         int c;
38         int x;
39         long long y;
40         int neg = 0;
41         
42         *pcnt += (c=getc(f))>=0;
43         if (c=='+' || c=='-') {
44                 neg = (c=='-');
45                 *pcnt += (c=getc(f))>=0;
46                 if (c-'0'>=10U) {
47                         if (c>=0) {
48                                 ungetc(c, f);
49                                 --*pcnt;
50                         }
51                         return LLONG_MIN;
52                 }
53         }
54         for (x=0; c-'0'<10U && x<INT_MAX/10; *pcnt += (c=getc(f))>=0)
55                 x = 10*x + c-'0';
56         for (y=x; c-'0'<10U && x<LLONG_MAX/10; *pcnt += (c=getc(f))>=0)
57                 y = 10*y + c-'0';
58         for (; c-'0'<10U; *pcnt += (c=getc(f))>=0);
59         if (c>=0) {
60                 ungetc(c, f);
61                 --*pcnt;
62         }
63         return neg ? -y : y;
64 }
65
66
67 static long double decfloat(FILE *f, int c, int bits, int emin, int sign, int pok, off_t *pcnt)
68 {
69         uint32_t x[KMAX];
70         static const uint32_t th[] = { LD_B1B_MAX };
71         int i, j, k, a, z;
72         long long lrp=-1, dc=0;
73         int gotdig = 0;
74         int rp;
75         int e10=0;
76         int e2;
77         long double y;
78         long double frac=0;
79         long double bias=0;
80
81         j=0;
82         k=0;
83
84         if (c<0) *pcnt += (c=getc(f))>=0;
85
86         /* Don't let leading zeros consume buffer space */
87         for (; c=='0'; *pcnt += (c=getc(f))>=0) gotdig=1;
88
89         x[0] = 0;
90         for (; c-'0'<10U || c=='.'; *pcnt += (c=getc(f))>=0) {
91                 if (c == '.') {
92                         if (lrp!=-1) break;
93                         lrp = dc;
94                 } else if (k < KMAX) {
95                         dc++;
96                         if (j) x[k] = x[k]*10 + c-'0';
97                         else x[k] = c-'0';
98                         if (++j==9) {
99                                 k++;
100                                 j=0;
101                         }
102                         gotdig=1;
103                 } else {
104                         dc++;
105                         x[KMAX-1] |= c-'0';
106                 }
107         }
108         if (lrp==-1) lrp=dc;
109
110         if (gotdig && (c|32)=='e') {
111                 e10 = scanexp(f, pcnt);
112                 if (e10 == LLONG_MIN) {
113                         if (!pok) {
114                                 *pcnt = 0;
115                                 return 0;
116                         }
117                         e10 = 0;
118                 }
119                 lrp += e10;
120         } else if (c>=0) {
121                 ungetc(c, f);
122                 --*pcnt;
123         }
124         if (!gotdig) {
125                 *pcnt = 0;
126                 return 0;
127         }
128
129         if (!x[0])
130                 return sign * 0.0;
131         if (lrp==dc && (!k || (k==1 && !j)) && (bits>30 || x[0]>>bits==0))
132                 return sign * (long double)x[0];
133         if (lrp > -emin/2)
134                 return sign * LDBL_MAX * LDBL_MAX;
135         if (lrp < emin-2*LDBL_MANT_DIG)
136                 return sign * LDBL_MIN * LDBL_MIN;
137
138         if (k<KMAX && j) {
139                 for (; j<9; j++) x[k]*=10;
140                 k++;
141                 j=0;
142         }
143
144         a = 0;
145         z = k;
146         e2 = 0;
147         rp = lrp;
148
149         while (rp < 18+9*LD_B1B_DIG) {
150                 uint32_t carry = 0;
151                 e2 -= 29;
152                 for (k=(z-1 & MASK); ; k=(k-1 & MASK)) {
153                         uint64_t tmp = ((uint64_t)x[k] << 29) + carry;
154                         if (tmp > 1000000000) {
155                                 carry = tmp / 1000000000;
156                                 x[k] = tmp % 1000000000;
157                         } else {
158                                 carry = 0;
159                                 x[k] = tmp;
160                         }
161                         if (k==(z-1 & MASK) && k!=a && !x[k]) z = k;
162                         if (k==a) break;
163                 }
164                 if (carry) {
165                         rp += 9;
166                         if (a == z) {
167                                 z = (z-1 & MASK);
168                                 x[z-1 & MASK] |= x[z];
169                         }
170                         a = (a-1 & MASK);
171                         x[a] = carry;
172                 }
173         }
174
175         if (rp % 9) {
176                 static const int p10s[] = {
177                         100000000, 10000000, 1000000, 100000,
178                         10000, 1000, 100, 10
179                 };
180                 int rpm9 = rp % 9;
181                 int p10 = p10s[rpm9-1];
182                 uint32_t carry = 0;
183                 for (k=a; k!=z; k=(k+1 & MASK)) {
184                         uint32_t tmp = x[k] % p10;
185                         x[k] = x[k]/p10 + carry;
186                         carry = 1000000000/p10 * tmp;
187                         if (k==a && !x[k]) {
188                                 a = (a+1 & MASK);
189                                 rp -= 9;
190                         }
191                 }
192                 if (carry) {
193                         if ((z+1 & MASK) != a) {
194                                 x[z] = carry;
195                                 z = (z+1 & MASK);
196                         } else x[z-1 & MASK] |= 1;
197                 }
198                 rp += 9-rpm9;
199         }
200
201         for (;;) {
202                 uint32_t carry = 0;
203                 int sh = 1;
204                 for (i=0; i<LD_B1B_DIG; i++) {
205                         k = (a+i & MASK);
206                         if (k == z || x[k] < th[i]) {
207                                 i=LD_B1B_DIG;
208                                 break;
209                         }
210                         if (x[a+i & MASK] > th[i]) break;
211                 }
212                 if (i==LD_B1B_DIG && rp==9*LD_B1B_DIG) break;
213                 /* FIXME: find a way to compute optimal sh */
214                 if (rp > 9+9*LD_B1B_DIG) sh = 9;
215                 e2 += sh;
216                 for (k=a; k!=z; k=(k+1 & MASK)) {
217                         uint32_t tmp = x[k] & (1<<sh)-1;
218                         x[k] = (x[k]>>sh) + carry;
219                         carry = (1000000000>>sh) * tmp;
220                         if (k==a && !x[k]) {
221                                 a = (a+1 & MASK);
222                                 rp -= 9;
223                         }
224                 }
225                 if (carry) {
226                         if ((z+1 & MASK) != a) {
227                                 x[z] = carry;
228                                 z = (z+1 & MASK);
229                         } else x[z-1 & MASK] |= 1;
230                 }
231         }
232
233         for (y=i=0; i<LD_B1B_DIG && (a+i & MASK)!=z; i++)
234                 y = 1000000000.0L * y + x[a+i & MASK];
235
236         y *= sign;
237
238         if (bits > LDBL_MANT_DIG+e2-emin) {
239                 bits = LDBL_MANT_DIG+e2-emin;
240                 if (bits<0) bits=0;
241         }
242
243         if (bits < LDBL_MANT_DIG) {
244                 bias = copysignl(scalbn(1, 2*LDBL_MANT_DIG-bits-1), y);
245                 frac = fmodl(y, scalbn(1, LDBL_MANT_DIG-bits));
246                 y -= frac;
247                 y += bias;
248         }
249
250         if ((a+i & MASK) != z) {
251                 uint32_t t = x[a+i & MASK];
252                 if (t < 500000000 && (t || (a+i+1 & MASK) != z))
253                         frac += 0.25*sign;
254                 else if (t > 500000000)
255                         frac += 0.75*sign;
256                 else if (t == 500000000) {
257                         if ((a+i+1 & MASK) == z)
258                                 frac += 0.5*sign;
259                         else
260                                 frac += 0.75*sign;
261                 }
262                 if (LDBL_MANT_DIG-bits >= 2 && !fmodl(frac, 1))
263                         frac++;
264         }
265
266         y += frac;
267         y -= bias;
268
269         y = scalbnl(y, e2);
270
271         return y;
272 }
273
274 static long double hexfloat(FILE *f, int c, int bits, int emin, int sign, int pok, off_t *pcnt)
275 {
276         uint32_t x = 0;
277         long double y = 0;
278         long double scale = 1;
279         long double bias = 0;
280         int gottail = 0, gotrad = 0, gotdig = 0;
281         long long rp = 0;
282         long long dc = 0;
283         long long e2 = 0;
284         int d;
285
286         if (c<0) *pcnt += (c=getc(f))>=0;
287
288         /* Skip leading zeros */
289         for (; c=='0'; *pcnt += (c=getc(f))>=0) gotdig = 1;
290
291         if (c=='.') {
292                 gotrad = 1;
293                 *pcnt += (c=getc(f))>=0;
294                 /* Count zeros after the radix point before significand */
295                 for (rp=0; c=='0'; *pcnt += (c=getc(f))>=0, rp--) gotdig = 1;
296         }
297
298         for (; c-'0'<10U || (c|32)-'a'<6U || c=='.'; *pcnt += (c=getc(f))>=0) {
299                 if (c=='.') {
300                         if (gotrad) break;
301                         rp = dc;
302                         gotrad = 1;
303                 } else {
304                         gotdig = 1;
305                         if (c > '9') d = (c|32)+10-'a';
306                         else d = c-'0';
307                         if (dc<8) {
308                                 x = x*16 + d;
309                         } else if (dc < LDBL_MANT_DIG/4+1) {
310                                 y += d*(scale/=16);
311                         } else if (d && !gottail) {
312                                 y += 0.5*scale;
313                                 gottail = 1;
314                         }
315                         dc++;
316                 }
317         }
318         if (!gotdig) {
319                 if (c>=0) {
320                         ungetc(c, f);
321                         --*pcnt;
322                 }
323                 if (pok) *pcnt -= 1+gotrad; /* uncount the rp, x of 0x */
324                 else *pcnt = 0;
325                 return 0;
326         }
327         if (!gotrad) rp = dc;
328         while (dc<8) x *= 16, dc++;
329         if ((c|32)=='p') {
330                 e2 = scanexp(f, pcnt);
331                 if (e2 == LLONG_MIN) {
332                         if (!pok) {
333                                 *pcnt = 0;
334                                 return 0;
335                         }
336                         e2 = 0;
337                 }
338         }
339         e2 += 4*rp - 32;
340
341         if (!x) return sign * 0.0;
342         if (e2 > -emin) return sign * LDBL_MAX * LDBL_MAX;
343         if (e2 < emin-2*LDBL_MANT_DIG) return sign * LDBL_MIN * LDBL_MIN;
344
345         while (x < 0x80000000) {
346                 if (y>=0.5) {
347                         x += x + 1;
348                         y += y - 1;
349                 } else {
350                         x += x;
351                         y += y;
352                 }
353                 e2--;
354         }
355
356         if (bits > 32+e2-emin) {
357                 bits = 32+e2-emin;
358                 if (bits<0) bits=0;
359         }
360
361         if (bits < LDBL_MANT_DIG)
362                 bias = copysignl(scalbn(1, 32+LDBL_MANT_DIG-bits-1), sign);
363
364         if (bits<32 && y && !(x&1)) x++, y=0;
365
366         y = bias + sign*(long double)x + sign*y;
367         y -= bias;
368
369         return scalbnl(y, e2);
370 }
371
372 long double __floatscan(FILE *f, int c, int prec, int pok, off_t *pcnt)
373 {
374         int sign = 1;
375         int i;
376         int bits;
377         int emin;
378
379         *pcnt = 0;
380
381         switch (prec) {
382         case 0:
383                 bits = 24;
384                 emin = -149;
385                 break;
386         case 1:
387                 bits = 53;
388                 emin = -1074;
389                 break;
390         case 2:
391                 bits = LDBL_MANT_DIG;
392                 emin = -16445;
393                 break;
394         default:
395                 return 0;
396         }
397
398         if (c<0) *pcnt += (c=getc(f))>=0;
399
400         if (c=='+' || c=='-') {
401                 sign -= 2*(c=='-');
402                 *pcnt += (c=getc(f))>=0;
403         }
404
405         for (i=0; i<8 && (c|32)=="infinity"[i]; i++)
406                 if (i<7) c = getc(f);
407         if (i==3 || i==8 || (i>3 && pok)) {
408                 if (i==3 && c>=0) ungetc(c, f);
409                 if (i==8) *pcnt += 7;
410                 else *pcnt += 2;
411                 return sign * INFINITY;
412         }
413         if (!i) for (i=0; i<3 && (c|32)=="nan"[i]; i++)
414                 if (i<3) c = getc(f);
415         if (i==3) {
416                 *pcnt += 2;
417                 return sign>0 ? NAN : -NAN;
418         }
419
420         if (i) {
421                 if (c>=0) ungetc(c, f);
422                 *pcnt = 0;
423                 return 0;
424         }
425
426         if (c=='0') {
427                 *pcnt += (c=getc(f))>=0;
428                 if ((c|32) == 'x')
429                         return hexfloat(f, -1, bits, emin, sign, pok, pcnt);
430                 if (c>=0) {
431                         ungetc(c, f);
432                         --*pcnt;
433                 }
434                 c = '0';
435         }
436
437         return decfloat(f, c, bits, emin, sign, pok, pcnt);
438 }