Linux-2.6.12-rc2v2.6.12-rc2

Initial git repository build. I'm not bothering with the full history, even though we have it. We can create a separate "historical" git archive of that later if we want to, and in the meantime it's about 3.2GB when imported into git - space that would just make the early git days unnecessarily complicated, when we don't have a lot of good infrastructure for it. Let it rip!
author: Linus Torvalds <torvalds@ppc970.osdl.org> 2005-04-16 18:20:36 -0400
committer: Linus Torvalds <torvalds@ppc970.osdl.org> 2005-04-16 18:20:36 -0400
commit: 1da177e4c3f41524e886b7f1b8a0c1fc7321cac2 (patch)
tree: 0bba044c4ce775e45a88a51686b5d9f90697ea9d /arch/ppc/kernel/vector.S
1 files changed, 217 insertions, 0 deletions
diff --git a/arch/ppc/kernel/vector.S b/arch/ppc/kernel/vector.S
new file mode 100644
index 000000000000..82a21346bf80
--- /dev/null
+++ b/arch/ppc/kernel/vector.S
@@ -0,0 +1,217 @@
+#include <asm/ppc_asm.h>
+#include <asm/processor.h>
+/*
+ * The routines below are in assembler so we can closely control the
+ * usage of floating-point registers.  These routines must be called
+ * with preempt disabled.
+ */
+        .data
+fpzero:
+        .long   0
+fpone:
+        .long   0x3f800000      /* 1.0 in single-precision FP */
+fphalf:
+        .long   0x3f000000      /* 0.5 in single-precision FP */
+        .text
+/*
+ * Internal routine to enable floating point and set FPSCR to 0.
+ * Don't call it from C; it doesn't use the normal calling convention.
+ */
+fpenable:
+        mfmsr   r10
+        ori     r11,r10,MSR_FP
+        mtmsr   r11
+        isync
+        stfd    fr0,24(r1)
+        stfd    fr1,16(r1)
+        stfd    fr31,8(r1)
+        lis     r11,fpzero@ha
+        mffs    fr31
+        lfs     fr1,fpzero@l(r11)
+        mtfsf   0xff,fr1
+        blr
+fpdisable:
+        mtfsf   0xff,fr31
+        lfd     fr31,8(r1)
+        lfd     fr1,16(r1)
+        lfd     fr0,24(r1)
+        mtmsr   r10
+        isync
+        blr
+/*
+ * Vector add, floating point.
+ */
+        .globl  vaddfp
+vaddfp:
+        stwu    r1,-32(r1)
+        mflr    r0
+        stw     r0,36(r1)
+        bl      fpenable
+        li      r0,4
+        mtctr   r0
+        li      r6,0
+1:      lfsx    fr0,r4,r6
+        lfsx    fr1,r5,r6
+        fadds   fr0,fr0,fr1
+        stfsx   fr0,r3,r6
+        addi    r6,r6,4
+        bdnz    1b
+        bl      fpdisable
+        lwz     r0,36(r1)
+        mtlr    r0
+        addi    r1,r1,32
+        blr
+/*
+ * Vector subtract, floating point.
+ */
+        .globl  vsubfp
+vsubfp:
+        stwu    r1,-32(r1)
+        mflr    r0
+        stw     r0,36(r1)
+        bl      fpenable
+        li      r0,4
+        mtctr   r0
+        li      r6,0
+1:      lfsx    fr0,r4,r6
+        lfsx    fr1,r5,r6
+        fsubs   fr0,fr0,fr1
+        stfsx   fr0,r3,r6
+        addi    r6,r6,4
+        bdnz    1b
+        bl      fpdisable
+        lwz     r0,36(r1)
+        mtlr    r0
+        addi    r1,r1,32
+        blr
+/*
+ * Vector multiply and add, floating point.
+ */
+        .globl  vmaddfp
+vmaddfp:
+        stwu    r1,-48(r1)
+        mflr    r0
+        stw     r0,52(r1)
+        bl      fpenable
+        stfd    fr2,32(r1)
+        li      r0,4
+        mtctr   r0
+        li      r7,0
+1:      lfsx    fr0,r4,r7
+        lfsx    fr1,r5,r7
+        lfsx    fr2,r6,r7
+        fmadds  fr0,fr0,fr2,fr1
+        stfsx   fr0,r3,r7
+        addi    r7,r7,4
+        bdnz    1b
+        lfd     fr2,32(r1)
+        bl      fpdisable
+        lwz     r0,52(r1)
+        mtlr    r0
+        addi    r1,r1,48
+        blr
+/*
+ * Vector negative multiply and subtract, floating point.
+ */
+        .globl  vnmsubfp
+vnmsubfp:
+        stwu    r1,-48(r1)
+        mflr    r0
+        stw     r0,52(r1)
+        bl      fpenable
+        stfd    fr2,32(r1)
+        li      r0,4
+        mtctr   r0
+        li      r7,0
+1:      lfsx    fr0,r4,r7
+        lfsx    fr1,r5,r7
+        lfsx    fr2,r6,r7
+        fnmsubs fr0,fr0,fr2,fr1
+        stfsx   fr0,r3,r7
+        addi    r7,r7,4
+        bdnz    1b
+        lfd     fr2,32(r1)
+        bl      fpdisable
+        lwz     r0,52(r1)
+        mtlr    r0
+        addi    r1,r1,48
+        blr
+/*
+ * Vector reciprocal estimate.  We just compute 1.0/x.
+ * r3 -> destination, r4 -> source.
+ */
+        .globl  vrefp
+vrefp:
+        stwu    r1,-32(r1)
+        mflr    r0
+        stw     r0,36(r1)
+        bl      fpenable
+        lis     r9,fpone@ha
+        li      r0,4
+        lfs     fr1,fpone@l(r9)
+        mtctr   r0
+        li      r6,0
+1:      lfsx    fr0,r4,r6
+        fdivs   fr0,fr1,fr0
+        stfsx   fr0,r3,r6
+        addi    r6,r6,4
+        bdnz    1b
+        bl      fpdisable
+        lwz     r0,36(r1)
+        mtlr    r0
+        addi    r1,r1,32
+        blr
+/*
+ * Vector reciprocal square-root estimate, floating point.
+ * We use the frsqrte instruction for the initial estimate followed
+ * by 2 iterations of Newton-Raphson to get sufficient accuracy.
+ * r3 -> destination, r4 -> source.
+ */
+        .globl  vrsqrtefp
+vrsqrtefp:
+        stwu    r1,-48(r1)
+        mflr    r0
+        stw     r0,52(r1)
+        bl      fpenable
+        stfd    fr2,32(r1)
+        stfd    fr3,40(r1)
+        stfd    fr4,48(r1)
+        stfd    fr5,56(r1)
+        lis     r9,fpone@ha
+        lis     r8,fphalf@ha
+        li      r0,4
+        lfs     fr4,fpone@l(r9)
+        lfs     fr5,fphalf@l(r8)
+        mtctr   r0
+        li      r6,0
+1:      lfsx    fr0,r4,r6
+        frsqrte fr1,fr0         /* r = frsqrte(s) */
+        fmuls   fr3,fr1,fr0     /* r * s */
+        fmuls   fr2,fr1,fr5     /* r * 0.5 */
+        fnmsubs fr3,fr1,fr3,fr4 /* 1 - s * r * r */
+        fmadds  fr1,fr2,fr3,fr1 /* r = r + 0.5 * r * (1 - s * r * r) */
+        fmuls   fr3,fr1,fr0     /* r * s */
+        fmuls   fr2,fr1,fr5     /* r * 0.5 */
+        fnmsubs fr3,fr1,fr3,fr4 /* 1 - s * r * r */
+        fmadds  fr1,fr2,fr3,fr1 /* r = r + 0.5 * r * (1 - s * r * r) */
+        stfsx   fr1,r3,r6
+        addi    r6,r6,4
+        bdnz    1b
+        lfd     fr5,56(r1)
+        lfd     fr4,48(r1)
+        lfd     fr3,40(r1)
+        lfd     fr2,32(r1)
+        bl      fpdisable
+        lwz     r0,36(r1)
+        mtlr    r0
+        addi    r1,r1,32
+        blr
author	Linus Torvalds <torvalds@ppc970.osdl.org>	2005-04-16 18:20:36 -0400
committer	Linus Torvalds <torvalds@ppc970.osdl.org>	2005-04-16 18:20:36 -0400
commit	1da177e4c3f41524e886b7f1b8a0c1fc7321cac2 (patch)
tree	0bba044c4ce775e45a88a51686b5d9f90697ea9d /arch/ppc/kernel/vector.S

diff --git a/arch/ppc/kernel/vector.S b/arch/ppc/kernel/vector.S new file mode 100644 index 000000000000..82a21346bf80 --- /dev/null +++ b/arch/ppc/kernel/vector.S
@@ -0,0 +1,217 @@
	1	#include <asm/ppc_asm.h>
	2	#include <asm/processor.h>
	3
	4	/*
	5	* The routines below are in assembler so we can closely control the
	6	* usage of floating-point registers. These routines must be called
	7	* with preempt disabled.
	8	*/
	9	.data
	10	fpzero:
	11	.long 0
	12	fpone:
	13	.long 0x3f800000 /* 1.0 in single-precision FP */
	14	fphalf:
	15	.long 0x3f000000 /* 0.5 in single-precision FP */
	16
	17	.text
	18	/*
	19	* Internal routine to enable floating point and set FPSCR to 0.
	20	* Don't call it from C; it doesn't use the normal calling convention.
	21	*/
	22	fpenable:
	23	mfmsr r10
	24	ori r11,r10,MSR_FP
	25	mtmsr r11
	26	isync
	27	stfd fr0,24(r1)
	28	stfd fr1,16(r1)
	29	stfd fr31,8(r1)
	30	lis r11,fpzero@ha
	31	mffs fr31
	32	lfs fr1,fpzero@l(r11)
	33	mtfsf 0xff,fr1
	34	blr
	35
	36	fpdisable:
	37	mtfsf 0xff,fr31
	38	lfd fr31,8(r1)
	39	lfd fr1,16(r1)
	40	lfd fr0,24(r1)
	41	mtmsr r10
	42	isync
	43	blr
	44
	45	/*
	46	* Vector add, floating point.
	47	*/
	48	.globl vaddfp
	49	vaddfp:
	50	stwu r1,-32(r1)
	51	mflr r0
	52	stw r0,36(r1)
	53	bl fpenable
	54	li r0,4
	55	mtctr r0
	56	li r6,0
	57	1: lfsx fr0,r4,r6
	58	lfsx fr1,r5,r6
	59	fadds fr0,fr0,fr1
	60	stfsx fr0,r3,r6
	61	addi r6,r6,4
	62	bdnz 1b
	63	bl fpdisable
	64	lwz r0,36(r1)
	65	mtlr r0
	66	addi r1,r1,32
	67	blr
	68
	69	/*
	70	* Vector subtract, floating point.
	71	*/
	72	.globl vsubfp
	73	vsubfp:
	74	stwu r1,-32(r1)
	75	mflr r0
	76	stw r0,36(r1)
	77	bl fpenable
	78	li r0,4
	79	mtctr r0
	80	li r6,0
	81	1: lfsx fr0,r4,r6
	82	lfsx fr1,r5,r6
	83	fsubs fr0,fr0,fr1
	84	stfsx fr0,r3,r6
	85	addi r6,r6,4
	86	bdnz 1b
	87	bl fpdisable
	88	lwz r0,36(r1)
	89	mtlr r0
	90	addi r1,r1,32
	91	blr
	92
	93	/*
	94	* Vector multiply and add, floating point.
	95	*/
	96	.globl vmaddfp
	97	vmaddfp:
	98	stwu r1,-48(r1)
	99	mflr r0
	100	stw r0,52(r1)
	101	bl fpenable
	102	stfd fr2,32(r1)
	103	li r0,4
	104	mtctr r0
	105	li r7,0
	106	1: lfsx fr0,r4,r7
	107	lfsx fr1,r5,r7
	108	lfsx fr2,r6,r7
	109	fmadds fr0,fr0,fr2,fr1
	110	stfsx fr0,r3,r7
	111	addi r7,r7,4
	112	bdnz 1b
	113	lfd fr2,32(r1)
	114	bl fpdisable
	115	lwz r0,52(r1)
	116	mtlr r0
	117	addi r1,r1,48
	118	blr
	119
	120	/*
	121	* Vector negative multiply and subtract, floating point.
	122	*/
	123	.globl vnmsubfp
	124	vnmsubfp:
	125	stwu r1,-48(r1)
	126	mflr r0
	127	stw r0,52(r1)
	128	bl fpenable
	129	stfd fr2,32(r1)
	130	li r0,4
	131	mtctr r0
	132	li r7,0
	133	1: lfsx fr0,r4,r7
	134	lfsx fr1,r5,r7
	135	lfsx fr2,r6,r7
	136	fnmsubs fr0,fr0,fr2,fr1
	137	stfsx fr0,r3,r7
	138	addi r7,r7,4
	139	bdnz 1b
	140	lfd fr2,32(r1)
	141	bl fpdisable
	142	lwz r0,52(r1)
	143	mtlr r0
	144	addi r1,r1,48
	145	blr
	146
	147	/*
	148	* Vector reciprocal estimate. We just compute 1.0/x.
	149	* r3 -> destination, r4 -> source.
	150	*/
	151	.globl vrefp
	152	vrefp:
	153	stwu r1,-32(r1)
	154	mflr r0
	155	stw r0,36(r1)
	156	bl fpenable
	157	lis r9,fpone@ha
	158	li r0,4
	159	lfs fr1,fpone@l(r9)
	160	mtctr r0
	161	li r6,0
	162	1: lfsx fr0,r4,r6
	163	fdivs fr0,fr1,fr0
	164	stfsx fr0,r3,r6
	165	addi r6,r6,4
	166	bdnz 1b
	167	bl fpdisable
	168	lwz r0,36(r1)
	169	mtlr r0
	170	addi r1,r1,32
	171	blr
	172
	173	/*
	174	* Vector reciprocal square-root estimate, floating point.
	175	* We use the frsqrte instruction for the initial estimate followed
	176	* by 2 iterations of Newton-Raphson to get sufficient accuracy.
	177	* r3 -> destination, r4 -> source.
	178	*/
	179	.globl vrsqrtefp
	180	vrsqrtefp:
	181	stwu r1,-48(r1)
	182	mflr r0
	183	stw r0,52(r1)
	184	bl fpenable
	185	stfd fr2,32(r1)
	186	stfd fr3,40(r1)
	187	stfd fr4,48(r1)
	188	stfd fr5,56(r1)
	189	lis r9,fpone@ha
	190	lis r8,fphalf@ha
	191	li r0,4
	192	lfs fr4,fpone@l(r9)
	193	lfs fr5,fphalf@l(r8)
	194	mtctr r0
	195	li r6,0
	196	1: lfsx fr0,r4,r6
	197	frsqrte fr1,fr0 /* r = frsqrte(s) */
	198	fmuls fr3,fr1,fr0 /* r * s */
	199	fmuls fr2,fr1,fr5 /* r * 0.5 */
	200	fnmsubs fr3,fr1,fr3,fr4 /* 1 - s * r * r */
	201	fmadds fr1,fr2,fr3,fr1 /* r = r + 0.5 * r * (1 - s * r * r) */
	202	fmuls fr3,fr1,fr0 /* r * s */
	203	fmuls fr2,fr1,fr5 /* r * 0.5 */
	204	fnmsubs fr3,fr1,fr3,fr4 /* 1 - s * r * r */
	205	fmadds fr1,fr2,fr3,fr1 /* r = r + 0.5 * r * (1 - s * r * r) */
	206	stfsx fr1,r3,r6
	207	addi r6,r6,4
	208	bdnz 1b
	209	lfd fr5,56(r1)
	210	lfd fr4,48(r1)
	211	lfd fr3,40(r1)
	212	lfd fr2,32(r1)
	213	bl fpdisable
	214	lwz r0,36(r1)
	215	mtlr r0
	216	addi r1,r1,32
	217	blr