نحوه محاسبه حداقل مربعات دو مرحله ای در نرم افزار SPSS
Two Stage Least Squares (2SLS) Regression
رگرسیون حداقل مربعات دو مرحله ای یک روش پیشرفته رگرسیونی برای پوشش مدل هایی است که خاصیت بازگشتی بودن را که مفروضه اصلی رگرسیون خطی عمومی است، را نقض می کنند. به ویژه مدل هایی که محقق باید همبستگی بین یک یا تعداد بیشتری از متغیر های پیش بین خود را با متغیر وابسته مدل از نقطه نظر خطای اندازه گیری چک نماید. مدل رگرسیون عمومی فرض می کند که خطا ها در متغیر وابسته با متغیر های مستقل همبسته نیستند. زمانیکه این پیش فرض محقق نشود مثلا زمانیکه رابطه به صورت دو طرفه وجود داشته باشد، بر آورد رگرسیونی OLS معتبر نخواهد بود. رگرسیون 2SLS از متغیر هایی با حداکثر کارایی که با خطا ها نا همبسته هستند برای برآورد ارزش متغیر های مساله ساز در فاز اول استفاده نموده و سپس استفاده از این مقادیر تعریف شده برای برآورد مدل رگرسیون خطی و پیش بینی تغییرات متغیر وابسته(فاز دوم).
به عنوان مثال محققی علاقه مند است مطالعه کند که آیا میزان تقاضا برای یک برند خاص در یک کشور به قیمت آن برند و درآمد مشتریان بالفعل وابسته است یا خیر؟ مشکل این محقق برای استفاده از روش OLS این است که بین قیمت و تقاضا رابطه دو طرفه وجود دارد یعنی قیمت تعیین کننده تقاضا و تقاضا نیز تعیین کننده قیمت می تواند باشد. این حالت تحت عنوان حلقه های بازخوردی در مدلسازی آماری مطرح است. لذا در این حالت بهترین مدل برای برآورد این وضعیت با توجه به شرایط بیان شده حداقل مربعات دو مرحله ای است. در این مدل درامد مشتریان به همراه متغیر باز تعریف شده قیمت برای محاسبه یک پروکسی که با میزان خطای متغیر وابسته ناهمبسته است، مورد استفاده قرار می گیرد. این پروکسی در فاز اول تعریف می شود و در فاز دوم به عنوان متغیر مستقل وارد مدل می شود. در واقع این پروکسی برای از بین بردن وجود این رابطه دو طرفه بین قیمت و تقاضا است.
نرم افزار هایی چون SAS ،Eviews ،SHAZAM و ... می توانند محاسبه رگرسیون حداقل مربعات دو مرحله ای را انجام دهند. لیکن محاسبه با بسته نرم افزاری SPSS به دلیل سهولت کاربرد، کاربرد وسیع تری دارد. لذا در این مقاله با این نرم افزار یک نمونه مساله با این روش مورد تحلیل قرار می گیرد.
مثال: یک شرکت بازار یابی، فروش کالای چند رسانه ای و کتاب های آموزشی یک کمپانی را در اختیار گرفته است و به ازای فروش محصولات تولیدی این کمپانی درصدی را از آن دریافت می کند. این شرکت به کمک ارسال ایمیل محصولات موجود را به اطلاع اعضای سایت خود می رساند. در این رابطه این شرکت می خواهد مدلی را برای کل خرید هایی که به واسطه این ایمیل ها انجام می شود طراحی نماید تا به این وسیله متغیر های اصلی پیش بینی کننده میزان فروش خود را تعیین نماید.
مشاور بازار یابی این شرکت به عنوان محقق در نظر گرفته است که متغیر میزان کل فروش را به عنوان متغیر وابسته و متغیر های میزان تخفیف های ارائه شده توسط این سایت برای خرید های اینترنتی به صورت ماهیانه و تعداد پیشنهاد های ارائه شده به هر فرد برای خرید هر دو دسته کالا را به عنوان متغیر های پیش بینی کننده و متغیر های مرتبط با تخفیف خرید اینترنتی را به عنوان متغیر های کمکی وارد مدل نماید.
از آنجائیکه تخفیف ماهیانه مستقل از پیشنهاد های فروش خاص ارائه شده برای هر فرد است لیکن بر فروش این اقلام تایثر گذار است. از اینرو میزان فروش و میزان تخفیف با یکدیگر دارای رابطه دو سویه هستند و باید میزان فروش این اقلام را به عنوان متغیر های Lag یا متغیر های نگه داشته شده در اولین فاز در نظر بگیریم. لذا ابتدا به مسیر زیر وارد شده و گزینه Create Time series… را انتخاب می کنیم.
سپس میزان خرید این دو قلم کالا را انتخاب کرده و به کادر سمت راست منتقل می کنیم. و نوع تابع را روی Lag قرار می دهیم.
حال باید از خانواده رگرسیون ها، در نرم افزار SPSS گزینه Two Stage Least Squares را انتخاب کنیم.
حال باید در این مرحله متغیر تعداد کل خرید هایی که به واسطه ایمیل های ارسالی دریافت شده است را قسمت متغیر وابسته مدل وارد کنیم. زیرا هدف از این مطالعه شناسایی عواملی بود که تعداد کل این خرید را شناسایی می کنند تا در آینده این شرکت تبلیغاتی بتواند تمام برنامه های خود را بازار یابی هدفمند تر روی این عوامل متمرکز نماید.
سپس باید تعداد پیشنهاد های ارائه شده برای خرید کتاب و همچنین محصولات پند رسانه ای به همراه نوع پرداخت را که به دو فرم چک های بانکی و تحویل در هنگام دریافت محصول و پرداخت از طریق کارت های اعتباری است را به قسمت متغیر های پیش بینی کننده یا Explanatory وارد می کنیم. در این مرحله باید متغیر های مشکل ساز را در قسمت بهینه ساز یا سودمند سازی متغیر وارد کنیم. این متغیر ها نوع پرداخت هزینه، تخفیف ارائه شده برای خرید اینترنتی کتاب و تخفیف ارائه شده برای خرید اینترنتی چند رسانه ای و متغیر سودمند شده میزان فروش این اقلام است. سپس کلید OK را می زنیم.
برای استفاده از بخش برنامه نویسی نرم افزار در قسمت ادیتور باید دستور زیر را وارد کرد.
اولین خروجی این نرم افزار مربوط به بخش توصیفی متغیر های وارد شده به مدل است.
متغیر هایی که تحت عنوان Predictor مشخص شده اند متغیر هایی هستند که اثر آنها ابتدا در مقایسه با متغیر های سودمند شده برای کنترل میزان خطای به وجود آمده در رابطه با متغیر وابسته محاسبه می شود. متغییر هایی که تحت عنوان predictor and instrumental نام گذاری شده اند آنهایی هستند که برای محاسبه واقعی اثر متغیر های پیش بین مورد استفاده قرار می گیرند و برای خود آنها نیز ضرایب محاسبه می شود ولی برای متغیر هایی که فقط instrumental هستند، اثر کلی آنها در برآورد واقعی ضرایب متغری های پیش بین محاسبه می شود ولیکن برای آنها ضرایب محاسبه نمی شود.
در بخش بعدی خروجی، مقدار Multiple R یا همان ضریب همبستگی چند گانه که بیان رابطه خطی بین متغیر های پیش بینی کننده و متغیر مشاهده شده است، نشان از یک رابطه نسبتا متوسط تا ضعیف بین متغیر های پیش بینی کننده وارد شده به مدل و متغیر وابسته مدل دارد. توان دوم آن را که با R Square نمایش می دهند بین می کند که 14 درصد از میزان فروش محصولات این شرکت از طریق کانال ایمیل توسط متغیر های مورد مطالعه محقق قابل پیش بینی است. مقدار Adjusted نیز عمدتا برای مقایسه بین مدل ها کاربرد دارد.
جدول تحلیل واریانس نشان می دهد که در برآورد ضرایب رگرسیونی و میزان باقیمانده، اعتبار قابل قبولی برای مدل رگرسیونی وجود دارد زیرا که مقدار سطح معنی داری آن زیر 05/0 است.
در نهایت ضرایب متغیر های وارد شده به مدل در این بخش مشخص می شود که از روی این جدول می توان مدلی که محقق به دنبال ان بود را برای شرکت مورد نظر در تصمیم گیری ارائه نمود.
خلاصه این مدل به این ترتیب است که نشان می دهد میزان کلی فروش تابعی از این متغیر ها است:
رگرسیون حداقل مربعات دو مرحله ای یک روش پیشرفته رگرسیونی برای پوشش مدل هایی است که خاصیت بازگشتی بودن را که مفروضه اصلی رگرسیون خطی عمومی است، را نقض می کنند. به ویژه مدل هایی که محقق باید همبستگی بین یک یا تعداد بیشتری از متغیر های پیش بین خود را با متغیر وابسته مدل از نقطه نظر خطای اندازه گیری چک نماید. مدل رگرسیون عمومی فرض می کند که خطا ها در متغیر وابسته با متغیر های مستقل همبسته نیستند. زمانیکه این پیش فرض محقق نشود مثلا زمانیکه رابطه به صورت دو طرفه وجود داشته باشد، بر آورد رگرسیونی OLS معتبر نخواهد بود. رگرسیون 2SLS از متغیر هایی با حداکثر کارایی که با خطا ها نا همبسته هستند برای برآورد ارزش متغیر های مساله ساز در فاز اول استفاده نموده و سپس استفاده از این مقادیر تعریف شده برای برآورد مدل رگرسیون خطی و پیش بینی تغییرات متغیر وابسته(فاز دوم).
به عنوان مثال محققی علاقه مند است مطالعه کند که آیا میزان تقاضا برای یک برند خاص در یک کشور به قیمت آن برند و درآمد مشتریان بالفعل وابسته است یا خیر؟ مشکل این محقق برای استفاده از روش OLS این است که بین قیمت و تقاضا رابطه دو طرفه وجود دارد یعنی قیمت تعیین کننده تقاضا و تقاضا نیز تعیین کننده قیمت می تواند باشد. این حالت تحت عنوان حلقه های بازخوردی در مدلسازی آماری مطرح است. لذا در این حالت بهترین مدل برای برآورد این وضعیت با توجه به شرایط بیان شده حداقل مربعات دو مرحله ای است. در این مدل درامد مشتریان به همراه متغیر باز تعریف شده قیمت برای محاسبه یک پروکسی که با میزان خطای متغیر وابسته ناهمبسته است، مورد استفاده قرار می گیرد. این پروکسی در فاز اول تعریف می شود و در فاز دوم به عنوان متغیر مستقل وارد مدل می شود. در واقع این پروکسی برای از بین بردن وجود این رابطه دو طرفه بین قیمت و تقاضا است.
نرم افزار هایی چون SAS ،Eviews ،SHAZAM و ... می توانند محاسبه رگرسیون حداقل مربعات دو مرحله ای را انجام دهند. لیکن محاسبه با بسته نرم افزاری SPSS به دلیل سهولت کاربرد، کاربرد وسیع تری دارد. لذا در این مقاله با این نرم افزار یک نمونه مساله با این روش مورد تحلیل قرار می گیرد.
مثال: یک شرکت بازار یابی، فروش کالای چند رسانه ای و کتاب های آموزشی یک کمپانی را در اختیار گرفته است و به ازای فروش محصولات تولیدی این کمپانی درصدی را از آن دریافت می کند. این شرکت به کمک ارسال ایمیل محصولات موجود را به اطلاع اعضای سایت خود می رساند. در این رابطه این شرکت می خواهد مدلی را برای کل خرید هایی که به واسطه این ایمیل ها انجام می شود طراحی نماید تا به این وسیله متغیر های اصلی پیش بینی کننده میزان فروش خود را تعیین نماید.
مشاور بازار یابی این شرکت به عنوان محقق در نظر گرفته است که متغیر میزان کل فروش را به عنوان متغیر وابسته و متغیر های میزان تخفیف های ارائه شده توسط این سایت برای خرید های اینترنتی به صورت ماهیانه و تعداد پیشنهاد های ارائه شده به هر فرد برای خرید هر دو دسته کالا را به عنوان متغیر های پیش بینی کننده و متغیر های مرتبط با تخفیف خرید اینترنتی را به عنوان متغیر های کمکی وارد مدل نماید.
از آنجائیکه تخفیف ماهیانه مستقل از پیشنهاد های فروش خاص ارائه شده برای هر فرد است لیکن بر فروش این اقلام تایثر گذار است. از اینرو میزان فروش و میزان تخفیف با یکدیگر دارای رابطه دو سویه هستند و باید میزان فروش این اقلام را به عنوان متغیر های Lag یا متغیر های نگه داشته شده در اولین فاز در نظر بگیریم. لذا ابتدا به مسیر زیر وارد شده و گزینه Create Time series… را انتخاب می کنیم.
سپس میزان خرید این دو قلم کالا را انتخاب کرده و به کادر سمت راست منتقل می کنیم. و نوع تابع را روی Lag قرار می دهیم.
حال باید از خانواده رگرسیون ها، در نرم افزار SPSS گزینه Two Stage Least Squares را انتخاب کنیم.
حال باید در این مرحله متغیر تعداد کل خرید هایی که به واسطه ایمیل های ارسالی دریافت شده است را قسمت متغیر وابسته مدل وارد کنیم. زیرا هدف از این مطالعه شناسایی عواملی بود که تعداد کل این خرید را شناسایی می کنند تا در آینده این شرکت تبلیغاتی بتواند تمام برنامه های خود را بازار یابی هدفمند تر روی این عوامل متمرکز نماید.
سپس باید تعداد پیشنهاد های ارائه شده برای خرید کتاب و همچنین محصولات پند رسانه ای به همراه نوع پرداخت را که به دو فرم چک های بانکی و تحویل در هنگام دریافت محصول و پرداخت از طریق کارت های اعتباری است را به قسمت متغیر های پیش بینی کننده یا Explanatory وارد می کنیم. در این مرحله باید متغیر های مشکل ساز را در قسمت بهینه ساز یا سودمند سازی متغیر وارد کنیم. این متغیر ها نوع پرداخت هزینه، تخفیف ارائه شده برای خرید اینترنتی کتاب و تخفیف ارائه شده برای خرید اینترنتی چند رسانه ای و متغیر سودمند شده میزان فروش این اقلام است. سپس کلید OK را می زنیم.
برای استفاده از بخش برنامه نویسی نرم افزار در قسمت ادیتور باید دستور زیر را وارد کرد.
اولین خروجی این نرم افزار مربوط به بخش توصیفی متغیر های وارد شده به مدل است.
متغیر هایی که تحت عنوان Predictor مشخص شده اند متغیر هایی هستند که اثر آنها ابتدا در مقایسه با متغیر های سودمند شده برای کنترل میزان خطای به وجود آمده در رابطه با متغیر وابسته محاسبه می شود. متغییر هایی که تحت عنوان predictor and instrumental نام گذاری شده اند آنهایی هستند که برای محاسبه واقعی اثر متغیر های پیش بین مورد استفاده قرار می گیرند و برای خود آنها نیز ضرایب محاسبه می شود ولی برای متغیر هایی که فقط instrumental هستند، اثر کلی آنها در برآورد واقعی ضرایب متغری های پیش بین محاسبه می شود ولیکن برای آنها ضرایب محاسبه نمی شود.
در بخش بعدی خروجی، مقدار Multiple R یا همان ضریب همبستگی چند گانه که بیان رابطه خطی بین متغیر های پیش بینی کننده و متغیر مشاهده شده است، نشان از یک رابطه نسبتا متوسط تا ضعیف بین متغیر های پیش بینی کننده وارد شده به مدل و متغیر وابسته مدل دارد. توان دوم آن را که با R Square نمایش می دهند بین می کند که 14 درصد از میزان فروش محصولات این شرکت از طریق کانال ایمیل توسط متغیر های مورد مطالعه محقق قابل پیش بینی است. مقدار Adjusted نیز عمدتا برای مقایسه بین مدل ها کاربرد دارد.
جدول تحلیل واریانس نشان می دهد که در برآورد ضرایب رگرسیونی و میزان باقیمانده، اعتبار قابل قبولی برای مدل رگرسیونی وجود دارد زیرا که مقدار سطح معنی داری آن زیر 05/0 است.
در نهایت ضرایب متغیر های وارد شده به مدل در این بخش مشخص می شود که از روی این جدول می توان مدلی که محقق به دنبال ان بود را برای شرکت مورد نظر در تصمیم گیری ارائه نمود.
خلاصه این مدل به این ترتیب است که نشان می دهد میزان کلی فروش تابعی از این متغیر ها است:
Y= -1.511 + 0.353 * buycd + 0.189 * buybk + 0.130 * offer_type1 + 0.303 * offer_type2
میزان سطح معنی داری برای متغیر نوع پرداخت اول که از طریق کارت های اعتباری است بیشتر از 05/0 محاسبه شده است، لذا سطح کلی فروش را این نوع پرداخت نمی تواند به خوبی متمایز کند. در حالیکه این مقدار برای نوع پرداخت دوم که از طریق پرداخت هنگام دریافت محصول بوده است به دلیل کمتر بودن سطح معنی داری از 05/0، از قابلیت خوبی برای تبیین میزان کلی فروش برخور دار است. لذا در ارائه پیشنهاد های خرید، پیشنهاد هایی که پرداختشان از طریق پرداخت هنگام دریافت بوده است از قابلیت خوبی در پیش بینی متغیر وابسته یعنی میزان فروش برخور دار است و این گونه پیشنهاد های خرید بیشتر به خرید دو قلم کالا منجر شده است. این وضعیت برای پیشنهاد های خرید چند رسانه ای در مقابل کتاب نیز صادق است. از اینرو نتیجه می شود گرفت که روش های بازار یابی کنونی شرکت برای فروش کلی این دو قلم کالا در بازه زمانی مورد مطالعه روی فروش چند رسانه ای و به شرط پرداخت در هنگام دریافت بیشتر موثر بوده است. لذا فروش کتاب از طریق این سیستم چندان اقتصادی به نظر نمی رسد و روش بازار یابی کتاب باید تغییر کند. همچنین باید توجه کرد که متغیر های پیش بین مورد مطالعه بیشتری برای بررسی عوامل تبیین کننده میزان فروش این شرکت باید مورد مطالعه قرار گیرد. The golden opportunity you're seeking is in Yourself. It's not in your environment, in luck, in chance, or the help of other; it is in yourself Alone
راه های دریافت رایگان مقالات و کتاب ها
اهــدای سلول بنیادی - اهـــدای عضو - محک
لطفا سوالاتتون رو در فروم بپرسید و از پیام خصوصی برای این منظور استفاده نکنید. در صورتی که مایلید من به سوال شما پاسخ بدم @Mami رو در متن سوال قرار بدید.
راه های دریافت رایگان مقالات و کتاب ها
اهــدای سلول بنیادی - اهـــدای عضو - محک
لطفا سوالاتتون رو در فروم بپرسید و از پیام خصوصی برای این منظور استفاده نکنید. در صورتی که مایلید من به سوال شما پاسخ بدم @Mami رو در متن سوال قرار بدید.