Mini Kabibi Habibi

Current Path : C:/Users/ITO/AppData/Roaming/NVIDIA/ComputeCache/a/2/
Upload File :
Current File : C:/Users/ITO/AppData/Roaming/NVIDIA/ComputeCache/a/2/4932ad1d57a018

A_+j��9j�kernel void __MX_Test_justIterate(global float* v, int len ){                              int gid = get_global_id(0);                              if(gid>=len) return;                              float data = v[gid];                              float variant = (float)(gid % 3);                              for ( int i = 0 ; i < 4096; i++){                              data = data  *  1.2f * variant ;                              }                              v [ gid ] = data ;                              } -cl-nv-arch sm_35  -nv-m64#456.71//
// Generated by NVIDIA NVVM Compiler
//
// Compiler Build ID: UNKNOWN
// Unknown Toolkit Version
// Based on LLVM 3.4svn
//

.version 7.1
.target sm_35, texmode_independent
.address_size 64

	// .globl	__MX_Test_justIterate

.entry __MX_Test_justIterate(
	.param .u64 .ptr .global .align 4 __MX_Test_justIterate_param_0,
	.param .u32 __MX_Test_justIterate_param_1
)
{
	.reg .pred 	%p<3>;
	.reg .f32 	%f<69>;
	.reg .b32 	%r<17>;
	.reg .b64 	%rd<4>;


	ld.param.u64 	%rd2, [__MX_Test_justIterate_param_0];
	ld.param.u32 	%r4, [__MX_Test_justIterate_param_1];
	mov.b32	%r5, %envreg3;
	mov.u32 	%r6, %ctaid.x;
	mov.u32 	%r7, %ntid.x;
	mad.lo.s32 	%r8, %r6, %r7, %r5;
	mov.u32 	%r9, %tid.x;
	add.s32 	%r1, %r8, %r9;
	setp.ge.s32	%p1, %r1, %r4;
	@%p1 bra 	BB0_4;

	mul.wide.s32 	%rd3, %r1, 4;
	add.s64 	%rd1, %rd2, %rd3;
	mul.hi.s32 	%r11, %r1, 1431655766;
	shr.u32 	%r12, %r11, 31;
	add.s32 	%r13, %r11, %r12;
	mul.lo.s32 	%r14, %r13, 3;
	sub.s32 	%r15, %r1, %r14;
	cvt.rn.f32.s32	%f1, %r15;
	ld.global.f32 	%f68, [%rd1];
	mov.u32 	%r16, -4096;

BB0_2:
	mul.f32 	%f5, %f68, 0f3F99999A;
	mul.f32 	%f6, %f1, %f5;
	mul.f32 	%f7, %f6, 0f3F99999A;
	mul.f32 	%f8, %f1, %f7;
	mul.f32 	%f9, %f8, 0f3F99999A;
	mul.f32 	%f10, %f1, %f9;
	mul.f32 	%f11, %f10, 0f3F99999A;
	mul.f32 	%f12, %f1, %f11;
	mul.f32 	%f13, %f12, 0f3F99999A;
	mul.f32 	%f14, %f1, %f13;
	mul.f32 	%f15, %f14, 0f3F99999A;
	mul.f32 	%f16, %f1, %f15;
	mul.f32 	%f17, %f16, 0f3F99999A;
	mul.f32 	%f18, %f1, %f17;
	mul.f32 	%f19, %f18, 0f3F99999A;
	mul.f32 	%f20, %f1, %f19;
	mul.f32 	%f21, %f20, 0f3F99999A;
	mul.f32 	%f22, %f1, %f21;
	mul.f32 	%f23, %f22, 0f3F99999A;
	mul.f32 	%f24, %f1, %f23;
	mul.f32 	%f25, %f24, 0f3F99999A;
	mul.f32 	%f26, %f1, %f25;
	mul.f32 	%f27, %f26, 0f3F99999A;
	mul.f32 	%f28, %f1, %f27;
	mul.f32 	%f29, %f28, 0f3F99999A;
	mul.f32 	%f30, %f1, %f29;
	mul.f32 	%f31, %f30, 0f3F99999A;
	mul.f32 	%f32, %f1, %f31;
	mul.f32 	%f33, %f32, 0f3F99999A;
	mul.f32 	%f34, %f1, %f33;
	mul.f32 	%f35, %f34, 0f3F99999A;
	mul.f32 	%f36, %f1, %f35;
	mul.f32 	%f37, %f36, 0f3F99999A;
	mul.f32 	%f38, %f1, %f37;
	mul.f32 	%f39, %f38, 0f3F99999A;
	mul.f32 	%f40, %f1, %f39;
	mul.f32 	%f41, %f40, 0f3F99999A;
	mul.f32 	%f42, %f1, %f41;
	mul.f32 	%f43, %f42, 0f3F99999A;
	mul.f32 	%f44, %f1, %f43;
	mul.f32 	%f45, %f44, 0f3F99999A;
	mul.f32 	%f46, %f1, %f45;
	mul.f32 	%f47, %f46, 0f3F99999A;
	mul.f32 	%f48, %f1, %f47;
	mul.f32 	%f49, %f48, 0f3F99999A;
	mul.f32 	%f50, %f1, %f49;
	mul.f32 	%f51, %f50, 0f3F99999A;
	mul.f32 	%f52, %f1, %f51;
	mul.f32 	%f53, %f52, 0f3F99999A;
	mul.f32 	%f54, %f1, %f53;
	mul.f32 	%f55, %f54, 0f3F99999A;
	mul.f32 	%f56, %f1, %f55;
	mul.f32 	%f57, %f56, 0f3F99999A;
	mul.f32 	%f58, %f1, %f57;
	mul.f32 	%f59, %f58, 0f3F99999A;
	mul.f32 	%f60, %f1, %f59;
	mul.f32 	%f61, %f60, 0f3F99999A;
	mul.f32 	%f62, %f1, %f61;
	mul.f32 	%f63, %f62, 0f3F99999A;
	mul.f32 	%f64, %f1, %f63;
	mul.f32 	%f65, %f64, 0f3F99999A;
	mul.f32 	%f66, %f1, %f65;
	mul.f32 	%f67, %f66, 0f3F99999A;
	mul.f32 	%f68, %f1, %f67;
	add.s32 	%r16, %r16, 32;
	setp.ne.s32	%p2, %r16, 0;
	@%p2 bra 	BB0_2;

	st.global.f32 	[%rd1], %f68;

BB0_4:
	ret;
}