optimize scalbn family

author Rich Felker <dalias@aerifal.cx>

Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)

committer Rich Felker <dalias@aerifal.cx>

Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)
author Rich Felker <dalias@aerifal.cx>
Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)
committer Rich Felker <dalias@aerifal.cx>
Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)
diff --git a/src/math/i386/scalbn.s b/src/math/i386/scalbn.s

index e275d14..8bf302f 100644 (file)
--- a/src/math/i386/scalbn.s
+++ b/src/math/i386/scalbn.s
@@ -11,10 +11,23 @@ scalbln:
  .global scalbn
  .type scalbn,@function
  scalbn:
-       fildl 12(%esp)
+       mov 12(%esp),%eax
+       add $0x3ffe,%eax
+       cmp $0x7ffd,%eax
+       jb 1f
+       sub $0x3ffe,%eax
+       sar $31,%eax
+       xor $0xfff,%eax
+       add $0x3ffe,%eax
+1:     inc %eax
         fldl 4(%esp)
-       fscale
-       fstp %st(1)
+       mov %eax,12(%esp)
+       mov $0x80000000,%eax
+       mov %eax,8(%esp)
+       xor %eax,%eax
+       mov %eax,4(%esp)
+       fldt 4(%esp)
+       fmulp
         fstpl 4(%esp)
         fldl 4(%esp)
         ret
diff --git a/src/math/i386/scalbnf.s b/src/math/i386/scalbnf.s

index 40232b6..9cb9ef5 100644 (file)
--- a/src/math/i386/scalbnf.s
+++ b/src/math/i386/scalbnf.s
@@ -11,10 +11,22 @@ scalblnf:
  .global scalbnf
  .type scalbnf,@function
  scalbnf:
-       fildl 8(%esp)
+       mov 8(%esp),%eax
+       add $0x3fe,%eax
+       cmp $0x7fd,%eax
+       jb 1f
+       sub $0x3fe,%eax
+       sar $31,%eax
+       xor $0x1ff,%eax
+       add $0x3fe,%eax
+1:     inc %eax
+       shl $20,%eax
         flds 4(%esp)
-       fscale
-       fstp %st(1)
+       mov %eax,8(%esp)
+       xor %eax,%eax
+       mov %eax,4(%esp)
+       fldl 4(%esp)
+       fmulp
         fstps 4(%esp)
         flds 4(%esp)
         ret
diff --git a/src/math/i386/scalbnl.s b/src/math/i386/scalbnl.s

index 224b1be..54414c2 100644 (file)
--- a/src/math/i386/scalbnl.s
+++ b/src/math/i386/scalbnl.s
@@ -11,7 +11,21 @@ scalblnl:
  .global scalbnl
  .type scalbnl,@function
  scalbnl:
-       fildl 16(%esp)
+       mov 16(%esp),%eax
+       add $0x3ffe,%eax
+       cmp $0x7ffd,%eax
+       jae 1f
+       inc %eax
+       fldt 4(%esp)
+       mov %eax,12(%esp)
+       mov $0x80000000,%eax
+       mov %eax,8(%esp)
+       xor %eax,%eax
+       mov %eax,4(%esp)
+       fldt 4(%esp)
+       fmulp
+       ret
+1:     fildl 16(%esp)
         fldt 4(%esp)
         fscale
         fstp %st(1)
author	Rich Felker <dalias@aerifal.cx>
	Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)
committer	Rich Felker <dalias@aerifal.cx>
	Tue, 20 Mar 2012 04:51:32 +0000 (00:51 -0400)
src/math/i386/scalbn.s		patch \| blob \| history
src/math/i386/scalbnf.s		patch \| blob \| history
src/math/i386/scalbnl.s		patch \| blob \| history